본문 바로가기

NLP 프로젝트 일지[0505~]

Doc2vec 만들기

자연어 처리는 word embedding 기준으로 크게 1) 단어의 갯수를 세는 방식과 2) 단어의 벡터거리를 기준으로 유사도를 확인할 수 있는 방식으로 나뉜다. 

1)의 경우 TF-IDF 알고리즘을 사용하여 분석

2)의 경우 doc2vec를 사용하여 분석

 

 

 

 

 

 

참고

http://hero4earth.com/blog/projects/2018/01/21/naver_movie_review/