BASHA TECH
Ch17. 자연어 처리 본문
728x90
1. 텍스트의 토큰화 (분리)
: 텍스트를 잘게 나누기 => 단어별, 문장별, 형태소별 (의미 있는 최소 단위로)
2. 단어의 원-핫 인코딩
단어가 숫자로 바뀜 : Vectorize
3. 단어 임베딩
4. 텍스트를 읽고 긍,부정 예측하기
728x90
반응형
'Computer > Deep Learning' 카테고리의 다른 글
Ch19. GAN - Auto Encoder (0) | 2022.11.15 |
---|---|
Ch18. RNN (시퀀스 배열로 다루는 순환 신경망) (0) | 2022.11.15 |
Ch16. CNN (0) | 2022.11.15 |
Ch15. 실제 데이터로 만들어 보는 모델 (0) | 2022.11.15 |
Ch14. 모델 성능 향상 (0) | 2022.11.15 |
Comments