[ 목차 ]
728x90
반응형
1. 형태소 분석
- 자연 언어의 문장을 형태소라는 최소 단위로 분할하고 품사를 판별하는 작업
- 영어 형태소 분석은 형태소마다 띄어쓰기를 해서 문장을 구성하는 것이 기본임(분석이 쉬운편)
- 아시아 계열 언어분석은 많은 노력이 필요
- 한국어 형태소 분석 라이브러리: KoNLpy
2. KoNLPy에 다양한 형태소 분석 라이브러리
- Hannanum: 한나눔. KAIST Semantic Web Research Center 개발
- KKma: 꼬꼬마. 서울대학교 IDS(Intelligent Data Systems) 연구실 개발
- Komoran: 코모란. Shineware에서 개발
- Mecab: 메카브. 일본어용 형태소 분석기를 한국어로 사용할 수 있도록 수정 개발
- OKT(Open Korean Text): 오픈소스 한국어 분석기. 과거 트위터 형태소 분석기
반응형
'Python > 데이터분석' 카테고리의 다른 글
Python 데이터분석 크롤링(벅스뮤직, 멜론, 지니 차트) (0) | 2023.02.24 |
---|---|
Python 데이터 분석 - 워드 클라우드 (0) | 2023.02.20 |
Python 데이터분석 -쇼핑몰 고객주문 데이터 프로젝트 (0) | 2023.02.19 |
Python 데이터분석 matplotlib (0) | 2023.02.19 |
Python 데이터 분석 Data Preprecessing (0) | 2023.02.18 |