NLP 블로그 (link)
해야 할 일
1. 뉴스 기사 크롤링 코드 분석해서 기사 전문 받아오기
2. 여성혐오 기사인 것과 아닌 것을 분류하기.
3. csv 파일 추가하는 방법 찾아보기...
1. 우리가 저장해 둔 뉴스 기사가지고 우선 데이터셋을 만드는게 빠를 것 같다.-> csv 파일을 읽고 append 하기
2. pd.df 형식으로 받아온 csv 파일 중에서 필요한 정보만 추려서 다시 저장하기
필요한 정보는 title, description 을 합친 컬럼 하나와 레이블 컬럼 하나이다.
2.2. title, description 을 합치기
3. 레이블링 하기..
'NLP 프로젝트 일지[0505~]' 카테고리의 다른 글
[5.11] 3.1. NLP 모델 데이터 전처리 (0) | 2020.05.11 |
---|---|
3. 텍스트 전처리 (0) | 2020.05.07 |
2.1. 기사 다운받고 저장 형식분석하기 (0) | 2020.05.05 |
1. NLP 처리 프로세스 정리 (0) | 2020.05.05 |
밖에 드러내야지 행동을 할 것 같아 만든 카테고리 (0) | 2020.05.05 |