검색

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2

  • 교육기간4주
  • 교육시간20시간
  • 과정 소개
  • 학습 목차
  • 수강후기
  • 본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.
  • 학습차수 학습명 학습시간 학습
    1차시 파이썬 코드로 n-gram 구현하기 30분 미리보기
    2차시 nltk stopwords를 활용한 불용어 제거하기(1) 30분
    3차시 nltk stopwords를 활용한 불용어 제거하기(2) 30분
    4차시 nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항 30분
    5차시 한국어 불용어 제거하기 30분
    6차시 Stemming(스테밍)이란 무엇이고 왜 필요한가 30분
    7차시 Stemmer를 사용한 어간 추출 30분
    8차시 PorterStemmer vs LancasterStemmer 어간 추출 비교 30분
    9차시 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 30분
    10차시 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습 30분
    11차시 주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습 30분
    12차시 lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법 30분
    13차시 WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기 30분
    14차시 WordNetLemmatizer에서 제대로 처리하지 못하는 단어들 30분
    15차시 품사 정보를 제공하여 기본형(표제어) 추출 30분
    16차시 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1) 30분
    17차시 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2) 30분
    18차시 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3) 30분
    19차시 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4) 30분
    20차시 구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기 30분