목록분류 전체보기 (264)
BASHA TECH
## error 발생시, 별도로 저장한 bar.csv 불러오기 # bar.to_csv('../03.사전교육2일/data/bar.csv', index=False) bar = pd.read_csv('../03.사전교육2일/data/bar.csv') bar UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbb in position 0: invalid start byte 에러가 떴다. utf-8 방식으로 디코딩할 수 없다는 에러 알림이 떴다. 구글링을 하니, utf-8 방식의 디코딩에서 다른 유형의 디코딩으로 재설정해줘야한다는 글을 보았고, encoding='euc-kr' 또는 encoding='cp949'로 설정해주면 해결된다고 했다. ## error 발생시, ..
NLP이냐 텍스트 분석이냐? 1. 텍스트 분석 이해 - 텍스트 분석 수행 프로세스 - 파이썬 기반의 NLP, 텍스트 분석 패키지 2. 텍스트 사전 준비 작업 (텍스트 전처리) - 텍스트 정규화 - 클렌징 - 텍스트 토큰화 - 스톱 워드 제거 - Stemming가 Lemmatization 3. Bag of Words - BOW - BOW의 피처 벡터화 - 사이킷런의 Count 및 TF-IDF 벡터화 구현 : CountVectorizer, TfidVectorizer - BOW 벡터화를 위한 희소 행렬 - 희소 행렬 - COO 형식 - 희소 행렬 - CSR 형식 4. 텍스트 분류 실습 - 20 뉴스 그룹 분류 - 텍스트 정규화 - 피처 벡터화 변환과 머신러닝 모델 학습/예측/평가 - 사이킷런 파이프라인 사용 ..
I.O, D.O 변형 문장 연습
1. K-평균 알고리즘 이해 - 사이킷런 KMeans 클래스 소개 - K-평균을 이용한 붓꽃 데이터 세트 군집화 - 군집화 알고리즘 테스트를 위한 데이터 생성 2. 군집 평가 - 실루엣 분석의 개요 - 붓꽃 데이터 세트를 이용한 군집 평가 - 군집별 평균 실루엣 계수의 시각화를 통한 군집 개수 최적화 방법 3. 평균 이동 - 평균 이동의 개요 4. GMM (Gaussian Mixture Model) - GMM 소개 - GMM을 이용한 붓꽃 데이터 세트 군집화 - GMM과 K-평균의 비교 5. DBSCAN - DBSCAN 개요 - DBSCAN 적용하기 - 붓꽃 데이터 세트 - DBSCAN 적용하기 - make_circles( ) 데이터 세트 6. 군집화 실습 - 고객 세그먼테이션 - 고객 세그먼테이션의 정..
1. 차원 축소 (Dimension Reduction) 개요 2. PCA (Principal Component Analysis) 3. LDA (Linear Discriminant Analysis) 4. SVD (Singular Value Decomposition) 5. NMF (Non-Negative Matrix Factorization) 가장 중요한 키워드: 잠재적 요소 (Latent Factor) 매우 많은 차원을 가지고 있는 이미지나 텍스트에서 특정 부위(데이터의 답을 잘 설명해주는 피처)를 찾고 함축된 잠재적인 의미를 뽑아냄 => 차원 축소를 통해 데이터를 잘 설명해줄 수 있는 잠재적 요소를 추출
1. 회귀 소개 2. 단순 선형 회귀를 통한 회귀 이해 3. 비용 최소화 하기 - 경사 하강법 (Gradient Descent) 소개 4. 사이킷런 LinearRegression을 이용한 보스턴 주택 가격 예측 - LinearRegression 클래스 - Ordinary Least Squares - 회귀 평가 지표 - LinearRegression을 이용해 보스턴 주택 가격 회귀 구현 5. 다항 회귀와 과(대)적합/과소적합 dlgo - 다항 회귀 이해 - 다항 회귀를 이용한 과소적합 및 과적합 이해 - 편향-분산 트레이드오프(Bias-Variance Trade off) 6. 규제 선형 모델 - 릿지, 라쏘, 엘라스틱넷 - 규제 선형 모델의 개요 - 릿지 회귀 - 라쏘 회귀 - 엘라스틱넷 회귀 - 선형 회..
yo amo me : 난 나를 사랑해
1. 직선의 방정식 1) 3차원 공간에서 직선의 방정식 - 직선의 벡터 방정식 - 직선의 대칭방정식 - 직선의 매개변수 방정식 2) 두 점( x1, y1, z1), (x2, y2, z2)를 지나는 3차원 공간에서 직선의 방정식 3) n차원 공간에서 직선의 방정식 2. 평면의 방정식 1) 3차원 공간에서 평면의 방정식 - 평면의 벡터 방정식 - 평면의 방정식의 표준형 - 평면의 방정식의 일반형 3. 점과 평면 사이의 거리 1) 점과 직선 사이의 거리 2) 점과 평면 사이의 거리 3) 두 평면 사이의 거리 4) 점과 초평면 사이의 거리