BASHA TECH
Ch1. 파이썬 기반의 머신러닝과 생태계 이해 본문
728x90
1. 머신러닝의 개념
- 머신러닝의 분류
- 데이터 전쟁
- 파이썬과 R 기반의 머신러닝 비교
2. 파이썬 머신러닝 생태계를 구성하는 주요 패키지
- 파이썬 머신러닝을 위한 S/W 설치
3. 넘파이
- 넘파이 ndarray 개요
- ndarray의 데이터 타입
- ndarray를 편리하게 생성하기 - arange, zeros, ones
- ndarray의 차원과 크기를 변경하는 reshape()
- 넘파이의 ndarray의 데이터 세트 선택하기 - 인덱싱(Indexing)
- 행렬의 정렬 - sort()와 argsort()
- 선형대수 연산 - 행렬 내적과 전치 행렬 구하기
4. 데이터 핸들링 - 판다스
- 판다스 시작 - 파일을 DataFrame으로 로딩, 기본 API
- DataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환
- DataFrame의 칼럼 데이터 세트 생성과 수정
- DataFrame 데이터 삭제
- Index 객체
- 데이터 셀렉션 및 필터링
- 정렬, Aggregation 함수, GroupBy 적용
- 결손 데이터 처리하기
- apply lambda 식으로 데이터 가공
5. 정리
Anaconda Prompt
(base) C:\Windows\system32>conda activate ml-dev
(ml-dev) C:\Windows\system32>pip install ipykernel
실습 예제
import numpy as np
import pandas as pd
arr1 = np.arange(8)
arr1 # ndarray
arr3d = arr1.reshape((2,2,2))
arr3d
arr5 = arr3d.reshape(-1,1)
arr5
print(arr5.tolist())
arr1
arr1.shape
arr6 = arr1.reshape(-1,1) # 얘 때문에 2차원으로 바뀌었다
arr6.tolist()
list1 = [1,2,3] # 1차원
list1_df = pd.DataFrame(list1)
list1_df
list1 = [[1,2,3]] # 2차원
list1_df = pd.DataFrame(list1)
list1_df
list1 = [[1,2,3], [4,5,6]] # 2차원
list1_df = pd.DataFrame(list1)
list1_df
728x90
반응형
'Computer > Machine Learning' 카테고리의 다른 글
Human Activity Recognition Using Smartphones Data Set (0) | 2022.10.13 |
---|---|
Pima indian diabetes : 피마 인디언 당뇨병 예측 (0) | 2022.10.13 |
Ch3. 평가 (0) | 2022.10.12 |
Ch2. 사이킷런으로 시작하는 머신러닝 (0) | 2022.10.07 |
환경 세팅 Visual Studio Tools 설치 (0) | 2022.10.05 |
Comments