검색

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.3 한국어를 위한 KoNLPy 2

  • 교육기간4주
  • 교육시간20시간
  • 과정 소개
  • 학습 목차
  • 수강후기
  • 본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다.
  • 학습차수 학습명 학습시간 학습
    1차시 KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2) 24분 미리보기
    2차시 KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3) 24분
    3차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1) 24분
    4차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2) 24분
    5차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3) 24분
    6차시 단어주머니란 무엇인가 - Bag of words 24분
    7차시 빈도 수 기반의 핵심어 추출 24분
    8차시 TF-IDF 어휘 빈도 문서 역빈도 24분
    9차시 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리 24분
    10차시 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer 24분
    11차시 Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리 24분
    12차시 Bag of words 구현하기(4) - stopwords, punctuation 제거 24분
    13차시 사이킷런 BoW 구현1 24분
    14차시 사이킷런 BoW 구현2 - Count Vector 수치화 24분
    15차시 사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기 24분
    16차시 CountVectorizer 파라미터 옵션(1) - max_df, min_df 24분
    17차시 CountVectorizer 파라미터 옵션(2) - max_features, stop_words 24분
    18차시 CountVectorizer 파라미터 옵션(3) - ngram_range 24분
    19차시 TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1) 24분
    20차시 TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2) 24분