<미니프로젝트 1>
목적 | NLP 를 이용하여 성차별적 관행을 따르는 기사 분류하기 |
기간 | 5.10일까지 |
1. 기사 분류는 텍스트 분류 혹은 텍스트 군집화에 속한다. (텍스트 분류 후 텍스트 군집화를 이용하면 스스로 분류하지 않을까?)
2. 기사가 성차별적 관행에 대하여 비판적으로 서술하는지 여부는 텍스트 요약에 해당할 것 같지만. 일단 지금은 해당 기사가 여성혐오 사건을 다루는 기사인지를 분류하는 것이 우선이다.
3. NLP 처리를 하기 위해서 (1)텍스트 전처리를 하고 (2) 피처 백터화를 하고 (3) 머신러닝 모델링을 수행한다.
4. 다음 게시글에서는 텍스트 전처리 부분을 진행하고 정리하겠다.
'NLP 프로젝트 일지[0505~]' 카테고리의 다른 글
[5.11] 3.1. NLP 모델 데이터 전처리 (0) | 2020.05.11 |
---|---|
3. 텍스트 전처리 (0) | 2020.05.07 |
2.2. 훈련 데이터셋 만들기 (0) | 2020.05.07 |
2.1. 기사 다운받고 저장 형식분석하기 (0) | 2020.05.05 |
밖에 드러내야지 행동을 할 것 같아 만든 카테고리 (0) | 2020.05.05 |