| 1차시 |
KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2) |
24분 |
미리보기
|
| 2차시 |
KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3) |
24분 |
|
| 3차시 |
KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1) |
24분 |
|
| 4차시 |
KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2) |
24분 |
|
| 5차시 |
KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3) |
24분 |
|
| 6차시 |
단어주머니란 무엇인가 - Bag of words |
24분 |
|
| 7차시 |
빈도 수 기반의 핵심어 추출 |
24분 |
|
| 8차시 |
TF-IDF 어휘 빈도 문서 역빈도 |
24분 |
|
| 9차시 |
자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리 |
24분 |
|
| 10차시 |
자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer |
24분 |
|
| 11차시 |
Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리 |
24분 |
|
| 12차시 |
Bag of words 구현하기(4) - stopwords, punctuation 제거 |
24분 |
|
| 13차시 |
사이킷런 BoW 구현1 |
24분 |
|
| 14차시 |
사이킷런 BoW 구현2 - Count Vector 수치화 |
24분 |
|
| 15차시 |
사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기 |
24분 |
|
| 16차시 |
CountVectorizer 파라미터 옵션(1) - max_df, min_df |
24분 |
|
| 17차시 |
CountVectorizer 파라미터 옵션(2) - max_features, stop_words |
24분 |
|
| 18차시 |
CountVectorizer 파라미터 옵션(3) - ngram_range |
24분 |
|
| 19차시 |
TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1) |
24분 |
|
| 20차시 |
TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2) |
24분 |
|