| 1차시 |
파이썬 코드로 n-gram 구현하기 |
30분 |
미리보기
|
| 2차시 |
nltk stopwords를 활용한 불용어 제거하기(1) |
30분 |
|
| 3차시 |
nltk stopwords를 활용한 불용어 제거하기(2) |
30분 |
|
| 4차시 |
nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항 |
30분 |
|
| 5차시 |
한국어 불용어 제거하기 |
30분 |
|
| 6차시 |
Stemming(스테밍)이란 무엇이고 왜 필요한가 |
30분 |
|
| 7차시 |
Stemmer를 사용한 어간 추출 |
30분 |
|
| 8차시 |
PorterStemmer vs LancasterStemmer 어간 추출 비교 |
30분 |
|
| 9차시 |
주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 |
30분 |
|
| 10차시 |
주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습 |
30분 |
|
| 11차시 |
주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습 |
30분 |
|
| 12차시 |
lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법 |
30분 |
|
| 13차시 |
WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기 |
30분 |
|
| 14차시 |
WordNetLemmatizer에서 제대로 처리하지 못하는 단어들 |
30분 |
|
| 15차시 |
품사 정보를 제공하여 기본형(표제어) 추출 |
30분 |
|
| 16차시 |
정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1) |
30분 |
|
| 17차시 |
정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2) |
30분 |
|
| 18차시 |
정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3) |
30분 |
|
| 19차시 |
정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4) |
30분 |
|
| 20차시 |
구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기 |
30분 |
|