목록분류 전체보기 (264)
BASHA TECH
# library import import numpy as np import pandas as pd import matplotlib.pyplot as plt # 데이터 분리 from sklearn.model_selection import train_test_split # 점수(평가 지표) from sklearn.metrics import accuracy_score, precision_score, recall_score, roc_auc_score from sklearn.metrics import f1_score, confusion_matrix, precision_recall_curve, roc_curve # 정규화(표준화) from sklearn.preprocessing import StandardScal..
1. 정확도 2. 오차행렬 3. 정밀도와 재현율 4. F1 score 5. ROC score 6. 피마 인디언 당뇨병 예측 7. 정리 정밀도와 재현율은 상관 관계 하지만 오차가 적고, TP가 크면 재현율, 정밀도 모두 높은 수치가 나올 수 있음. 그래서 정확도가 중요한 것임. 오차 중심으로 봐라 => 오차행렬 FN이 떨어짐 => 재현율 ↓, 오차↓ => 정밀, 재현 ↓ # 피마 인디언 당뇨병 예측 # library import import numpy as np import pandas as pd import matplotlib.pyplot as plt # 데이터 분리 from sklearn.model_selection import train_test_split # 점수(평가 지표) from sklearn..
재귀동사 : 타동사에 재귀대명사 'Se'를 붙여 자동사가 된 경우. 재귀 대명사 se는 주어의 인칭에 따라 me, te, se, nos, os, se 로 변화한다. 동사가 변화할 때 재귀 대명사 se는 동사 앞에 위치한다. - O를 필요로 하는 V => 타V - 타V + se => 자V : 재귀V casar : 결혼시키다 casarse : 결혼하다 lavarse : 씻기다 lavarse : 씻다 levantar : 일으켜 세우다 levantarse : 일어나다 despertar : 깨우다 despertarse : 잠에서 깨다 duchar : 샤워시키다 ducharse : 샤워하다 sentar : 앉히다 sentarse : 앉다 acostar : 눕히다 acostarse : 잠자리에 들다 lamar lam..
KeyError: "None of [Index(['Survived'], dtype='object')] are in the [columns]" 어쩐지 데이터 값들이 모두 이상하더라니!!!!!!! key 가 없더라니!!!!!!! train = pd.read_csv('/content/drive/MyDrive/tdata/train.csv') test = pd.read_csv('/content/drive/MyDrive/tdata/test.csv') 코드를 train = pd.read_csv('/content/drive/MyDrive/tdata/test.csv') test = pd.read_csv('/content/drive/MyDrive/tdata/train.csv') 경로 설정 잘못 해줌...ㅎ 바부다 바부....
1. 사이킷런 소개와 특징 2. 첫 번째 머신러닝 만들어 보기 - 붓꽃 품종 예측하기 3. 사이킷런의 기반 프레임워크 익히기 - Estimator 이해 및 fit(), predict() 메소드 - 사이킷런의 주요 모듈 - 내장된 예제 데이터 세트 4. Model Selection 모듈 소개 - 학습 / 테스트 데이터 세트 분리 - train_test_split() - 교차 검증 - GridSearchCV - 교차 검증과 최적 하이퍼 파라미터 튜닝을 한 번에 5. 데이터 전처리 - 데이터 인코딩 - 피처 스케일리과 정규화 - StandardScaler - MiniMaxScaler - 학습 데이터와 테스트 데이터의 스케일링 변환 시 유의점 6. 사이킷런으로 수행하는 데이터의 스케일링 변환 시 유의점 7. 정..
la sopa es salada 국이 짜다. - hay 동사 - hay와 estar 차이 - 위치 표현
실상은 공부하러 학원을 가는 현실~...! ㅠㅠ 저는 학원을 갑니다. = > Voy académica.... X( 기타 불규칙 동사 - Ver, Dar, Ir
1. 머신러닝의 개념 - 머신러닝의 분류 - 데이터 전쟁 - 파이썬과 R 기반의 머신러닝 비교 2. 파이썬 머신러닝 생태계를 구성하는 주요 패키지 - 파이썬 머신러닝을 위한 S/W 설치 3. 넘파이 - 넘파이 ndarray 개요 - ndarray의 데이터 타입 - ndarray를 편리하게 생성하기 - arange, zeros, ones - ndarray의 차원과 크기를 변경하는 reshape() - 넘파이의 ndarray의 데이터 세트 선택하기 - 인덱싱(Indexing) - 행렬의 정렬 - sort()와 argsort() - 선형대수 연산 - 행렬 내적과 전치 행렬 구하기 4. 데이터 핸들링 - 판다스 - 판다스 시작 - 파일을 DataFrame으로 로딩, 기본 API - DataFrame과 리스트, ..
피봇테이블(pivot table)이란 데이터 열 중에서 두 개의 열을 각각 행 인덱스, 열 인덱스로 사용하여 데이터를 조회하여 펼쳐놓은 것을 말한다. 판다스는 피봇테이블을 만들기 위한 pivot 메서드를 제공한다. 첫번째 인수로는 행 인덱스로 사용할 열 이름, 두번째 인수로는 열 인덱스로 사용할 열 이름, 그리고 마지막으로 데이터로 사용할 열 이름을 넣는다. 판다스는 지정된 두 열을 각각 행 인덱스와 열 인덱스로 바꾼 후 행 인덱스의 라벨 값이 첫번째 키의 값과 같고 열 인덱스의 라벨 값이 두번째 키의 값과 같은 데이터를 찾아서 해당 칸에 넣는다. 만약 주어진 데이터가 존재하지 않으면 해당 칸에 NaN 값을 넣는다. pivot_table¶ pivot_table Pandas는 pivot 명령과 groupb..
1. 데이터 셋 확인 - 데이터가 어떻게 구성되어있는지 확인한다. - null data가 존재한다면 확인 후 수정해야함. 2. 탐색적 데이터 분석 (EDA: Exploratory Data Analysis) - 여러 feature들을 개별적으로 분석하고, feature들 간의 상관관계를 확인한다. - 여러 시각화 툴을 이용하여 insight를 얻기. 3. 특성 공학 (Feature Engineering) - 모델을 만들기 전에 모델의 성능을 높힐 수 있도록 feature들을 engineering하기. - engineering 하는 방법에는 one-hot enconding, class 나누기, 구간으로 나누기, 텍스트 데이터 처리 등이 있다. 4. 모델 개발 및 학습 - sklearn, keras을 사용해 ..