에듀인기업연수

과정 소개
학습 목차
수강후기

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

학습차수	학습명	학습시간	학습
1차시	파이썬 코드로 n-gram 구현하기	30분	미리보기
2차시	nltk stopwords를 활용한 불용어 제거하기(1)	30분
3차시	nltk stopwords를 활용한 불용어 제거하기(2)	30분
4차시	nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항	30분
5차시	한국어 불용어 제거하기	30분
6차시	Stemming(스테밍)이란 무엇이고 왜 필요한가	30분
7차시	Stemmer를 사용한 어간 추출	30분
8차시	PorterStemmer vs LancasterStemmer 어간 추출 비교	30분
9차시	주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용	30분
10차시	주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습	30분
11차시	주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습	30분
12차시	lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법	30분
13차시	WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기	30분
14차시	WordNetLemmatizer에서 제대로 처리하지 못하는 단어들	30분
15차시	품사 정보를 제공하여 기본형(표제어) 추출	30분
16차시	정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1)	30분
17차시	정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2)	30분
18차시	정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3)	30분
19차시	정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4)	30분
20차시	구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기	30분