목록Computer (119)
BASHA TECH
8-1. 자료형 다루기 - 자료형 변환하기 - 잘못 입력한 데이터 처리하기 8-2. 카테고리 자료형 astype errors 인자에 설정할 수 있는 값 => raise : 숫자로 변환할 수 없는 값이 있음 오류 발생 (default임) coerce : 숫자로 변환 할 수 없는 값을 누락값으로 지정 ignore : 아무 작업도 하지 않음 downcast 인자 => integer, signed, unsigned, float 등
7-1. 열과 피벗 - 넓은 데이터 7-2. 열 이름 관리하기 - 하나의 열이 여러 의미를 가지고 있는 경우 - split 메서드로 열 이름 분리하기 7-3. 여러 열을 하나로 정리하기 7-4. 중복 데이터 처리하기 7-5. 대용량 데이터 처리하기 - 여러 개로 나누어진 데이터 불러오기 melt pivot : 진짜 많이 사용 drop_duplicates 메소드로 데이터 프레임의 중복 데이터 제거
6-1. 누락 값이란? - 누락값과 누락값 확인하기 - 누락값이 생기는 이유 - 누락값의 개수 - 누락값 처리하기 - 누락값이 포함된 데이터 계산하기 map(function, iterable) => 처리 filter(function, iterable) => 걸러낸다 NaN은 데이터 자체가 없다는 뜻. 늘 값이 없다. 그래서 비교연산하면 항상 False. 심지어 본인 스스로 비교해도 False임. => 그래서 쓰는 게 isnull method or notnull method 누락값 변경하기 > 1. 임의의 값 변경 2. 있는 값 변경 fillna method : NaN을 채워라. fillna 메소드 인자값을 ffill => 위에서 아래로 채움 / bfill => 위에서 아래로 채움 / interpolate..
5-1. 분석하기 좋은 데이터 - 분석하기 좋은 데이터란? 5-2. 데이터 연결 기초 - 행이 1개라도 반드시 데이터 프레임에 담아 연결해야 합니다. - 다양한 방법으로 데이터 연결하기 5-3. 데이터 연결 마무리 merge는 default가 inner join concat은 default가 outer join range는 잘 안 씀. # concat() => 데이터 프레임 연결 # 데이터 읽기 import pandas as pd df1 = pd.read_csv('../data/concat_1.csv') df2 = pd.read_csv('../data/concat_2.csv') df3 = pd.read_csv('../data/concat_3.csv') df1.head() df2.head() df3.hea..
4-1. 데이터 시각화가 필요한 이유 - 앤스콤 4분할 그래프 살펴보기 - 앤스콤 데이터 집합 모두 사용해 그래프 만들기 4-2. matplotlib 라이브러리 자유자재로 사용하기 - 기초 그래프 그리기 - 다변량 그래프 그리기 4-3. seaborn 라이브러리 자유자재로 사용하기 4-4. 데이터프레임과 시리즈로 그래프 그리기 4-5. seaborn 라이브러리로 그래프 스타일 설정하기 # anscombe dataset load import seaborn as sns anscombe = sns.load_dataset('anscombe') anscombe # 데이터 확인 anscombe.head() anscombe.info() anscombe['dataset'] # I 그룹 추출 # 데이터 프레임에 대괄호 ..
3-1. 나만의 데이터 만들기 3-2. 시리즈 다루기 - 기초 > 시리즈 속성과 메소드 사용하기 - index, values, keys > 시리즈 기초 통계 메소드 사용하기 3-3. 시리즈 다루기 응용 > 시리즈와 불린 추출 > 시리즈와 브로드캐스팅 3-4. 데이터프레임 다루기 3-4. 시리즈와 데이터프레임의 데이터 처리하기 3-6. 데이터 저장하고 불러오기
1. 데이터 만들기 1) 판다스 라이브러리 불러오기 2) 데이터 프레임 만들기 3) 데이터 프레임 출력하기 4) 데이터의 열 이름을 따로 지정해서 만들기 5) 인덱스가 2개인 데이터 프레임 만들기 2. 데이터 정렬하기 1) 특정 열 값을 기준으로 정렬하기 2) 열 이름 변경하기 3) 인덱스 값 초기화 하기 4) 인덱스 순서대로 정렬하기 5) 특정 열 제거하기 3. 행 추출하기 1) 맨 위의 행 출력하기 2) 맨 아래 행 출력하기 3) 특정 열의 값을 추출하기 4) 특정 열에 특정 값이 있을 경우 추출하기 5) 특정 열에 특정 값이 없을 경우 추출하기 6) 특정 열에 특정 숫자가 있는 지 확인하기 7) 특정 비율로 데이터 샘플링하기 8) 특정 개수 만큼 데이터 샘플링하기 9) 특정 열에서 큰 순서대로 불러..
2-1. 데이터 집합 불러오기 2-2. 데이터 추출하기 => 열 단위 데이터 추출 , 행 단위 데이터 추출, loc/iloc 2-3. 기초적인 통계 계산 2-4. 그래프 그리기 참고 링크 : https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html pandas.DataFrame — pandas 1.5.0 documentation Column labels to use for resulting frame when data does not have them, defaulting to RangeIndex(0, 1, 2, …, n). If data contains column labels, will perform column selection inst..
개발 툴들은 관리자 권한으로 해주기 C:\Windows\system32> Anaconda Prompt (base) C:\Windows\system32>d: (base) D:\>conda create -n pandas-dev python=3.8 (base) D:\>conda activate pandas-dev (pandas-dev) D:\>conda list # packages in environment at D:\Anaconda3\envs\pandas-dev: # # Name Version Build Channel ca-certificates 2022.07.19 haa95532_0 certifi 2022.9.14 py38haa95532_0 openssl 1.1.1q h2bbff1b_0 pip 22.1.2..
#1. 홍길동 씨의 과목별 점수는 다음과 같다. 홍길동 씨의 평균 점수를 구해 보자. # 과목점수 # 국어80 # 영어75 # 수학55 kor = 80 eng = 75 math = 55 avg = (kor + eng + math)/3 print(avg) => 70.0 #2. 자연수 13이 홀수인지 짝수인지 판별할 수 있는 방법에 대해 말해 보자. # 나머지 연산자를 사용하면, 자연수의 홀수 짝수를 쉽게 판별 가능 nn = 13 if (nn%2 == 0): print("짝수") else: print("홀수") => 홀수 #3. 홍길동씨의 주민등록번호는 881120-1068234이다. # 홍길동씨의 주민등록번호를 연월일(YYYYMMDD) 부분과 그 뒤의 숫자 부분으로 나누어 출력해 보자. hong = "88..