- tqdm 라이브러리
- time 라이브러리
데이터를 다운받을 때, 작업 진행 상황을 시각화하고 싶을 때 진행상태바가 0%에서 100%로 막대바가 채워지는 것을 본 적이 있을 것이다.
이는 데이터 양이 많아 진행 상황이 한세월인 딥러닝 진행 과정에서 뭔가 되고는 있구나 하는 심리적 안정감을 주기 위해 필요하다...
from tqdm import tqdm
from time import sleep
for i, line in enumerate(tqdm(range(900), total=10, desc="Loading Dataset", unit=" lines")):
sleep(0.01)
pass
- range(900) : 900만큼 반복한다.
- total : 10 개 마다 상태바 업데이트
- desc : 상태바 앞에 뭐라고 출력할까?
-unit : 반복하는 유닛은 뭐라고 출력할까?
- sleep 을 넣는 이유: 컴퓨터의 연산속도는 너무 빨라서 900번 반복 정도는 run 하자마자 끝난다. 상태바의 변화를 보여주기 위해 넣음.. 필요에 따라(가시화할 때) 종종 넣음....
* tip tqdm 라이브러리는 from tqdm import tqdm 해서 써야 함.
'NLP 프로젝트 일지[0505~]' 카테고리의 다른 글
Doc2vec 만들기 (0) | 2020.06.15 |
---|---|
새로운 task (0) | 2020.06.01 |
[5.13] torchtext를 이용하여 NLP 데이터셋 만들기 (0) | 2020.05.13 |
[5.12] 서브워드 분절 중... (0) | 2020.05.12 |
[5.11] 3.1. NLP 모델 데이터 전처리 (0) | 2020.05.11 |