에듀인기업연수

과정 소개
학습 목차
수강후기

본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다.

학습차수	학습명	학습시간	학습
1차시	KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2)	24분	미리보기
2차시	KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3)	24분
3차시	KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1)	24분
4차시	KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2)	24분
5차시	KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3)	24분
6차시	단어주머니란 무엇인가 - Bag of words	24분
7차시	빈도 수 기반의 핵심어 추출	24분
8차시	TF-IDF 어휘 빈도 문서 역빈도	24분
9차시	자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리	24분
10차시	자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer	24분
11차시	Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리	24분
12차시	Bag of words 구현하기(4) - stopwords, punctuation 제거	24분
13차시	사이킷런 BoW 구현1	24분
14차시	사이킷런 BoW 구현2 - Count Vector 수치화	24분
15차시	사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기	24분
16차시	CountVectorizer 파라미터 옵션(1) - max_df, min_df	24분
17차시	CountVectorizer 파라미터 옵션(2) - max_features, stop_words	24분
18차시	CountVectorizer 파라미터 옵션(3) - ngram_range	24분
19차시	TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1)	24분
20차시	TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2)	24분