| 1차시 |
강의개요 및 권장 학습순서와 NLTK 설치하기 |
15분 |
미리보기
|
| 2차시 |
corpus(말뭉치)란 무엇인가 |
15분 |
|
| 3차시 |
nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 |
15분 |
|
| 4차시 |
nltk gutenberg corpus 여러가지 값 출력 |
15분 |
|
| 5차시 |
nltk tokenization - sent_tokenize |
15분 |
|
| 6차시 |
word_tokeniz() 함수를 사용한 토큰화 vs gutenberg. words() 함수를 사용한 토큰화 비교 |
15분 |
|
| 7차시 |
각 토큰당 평균 문자 수 |
15분 |
|
| 8차시 |
브라운 코퍼스를 활용한 여러가지 메서드(1) |
15분 |
|
| 9차시 |
브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 |
15분 |
|
| 10차시 |
FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 |
15분 |
|
| 11차시 |
특정 단어의 빈도 수 체크 |
15분 |
|
| 12차시 |
특정 단어의 빈도 수 체크 - list comprehension 사용 |
15분 |
|
| 13차시 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 |
15분 |
|
| 14차시 |
전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 |
15분 |
|
| 15차시 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 |
15분 |
|
| 16차시 |
브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 |
15분 |
|
| 17차시 |
cfd 출력시 pair로 구성해서 출력하기 |
15분 |
|
| 18차시 |
브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 |
15분 |
|
| 19차시 |
n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 |
15분 |
|
| 20차시 |
nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 |
15분 |
|