BASHA TECH

Ch1. 파이썬 기반의 머신러닝과 생태계 이해 본문

Computer/Machine Learning

Ch1. 파이썬 기반의 머신러닝과 생태계 이해

Basha 2022. 10. 6. 17:58
728x90

1. 머신러닝의 개념

- 머신러닝의 분류

- 데이터 전쟁

- 파이썬과 R 기반의 머신러닝 비교

 

2. 파이썬 머신러닝 생태계를 구성하는 주요 패키지

- 파이썬 머신러닝을 위한 S/W 설치

 

3. 넘파이

- 넘파이 ndarray 개요

- ndarray의 데이터 타입

- ndarray를 편리하게 생성하기 - arange, zeros, ones

- ndarray의 차원과 크기를 변경하는 reshape()

- 넘파이의 ndarray의 데이터 세트 선택하기 - 인덱싱(Indexing)

- 행렬의 정렬 - sort()와 argsort()

- 선형대수 연산 - 행렬 내적과 전치 행렬 구하기

 

4. 데이터 핸들링 - 판다스

- 판다스 시작 - 파일을 DataFrame으로 로딩, 기본 API

- DataFrame과 리스트, 딕셔너리, 넘파이 ndarray 상호 변환

- DataFrame의 칼럼 데이터 세트 생성과 수정

- DataFrame 데이터 삭제

- Index 객체

- 데이터 셀렉션 및 필터링

- 정렬, Aggregation 함수, GroupBy 적용

- 결손 데이터 처리하기

- apply lambda 식으로 데이터 가공

 

5. 정리


Anaconda Prompt

(base) C:\Windows\system32>conda activate ml-dev

(ml-dev) C:\Windows\system32>pip install ipykernel

 

실습 예제

import numpy as np
import pandas as pd

arr1 = np.arange(8)
arr1 # ndarray

arr3d = arr1.reshape((2,2,2))
arr3d

arr5 = arr3d.reshape(-1,1)
arr5

print(arr5.tolist())

arr1

arr1.shape

arr6 = arr1.reshape(-1,1) # 얘 때문에 2차원으로 바뀌었다
arr6.tolist()

list1 = [1,2,3] # 1차원
list1_df = pd.DataFrame(list1)
list1_df

list1 = [[1,2,3]] # 2차원
list1_df = pd.DataFrame(list1)
list1_df

list1 = [[1,2,3], [4,5,6]] # 2차원
list1_df = pd.DataFrame(list1)
list1_df

ch01.ipynb
0.01MB

728x90
반응형
Comments