본문 바로가기

분류 전체보기

(68)
6장 모델평가와 하이퍼파라미터 튜닝의 모범 사례 6.4. 그리드 서치를 사용한 머신 러닝 모델 세부 튜닝 하이퍼 파라미터: 모델의 성능을 향상시키기 위해 튜닝하는 파라미터이다. 6.4.1. 그리드 서치 GridSearchCV: 하이퍼 파라미터 값에 대한 최적의 조건을 찾아 모델 성능을 향상시키는데 큰 도움이 된다. GridSearchCV의 파라미터는 다음과 같다. * estimator : 모델 * param_grid: key: list 구조를 갖는 딕셔너리. estimator 튜닝에 사용하는 파라미터 값을 지정한다. * scoring : 평가 방법 * cv : 학습/ 테스트 세트 개수 * refit : 디폴트가 True. True 로 하면 가장 최적의 하이퍼 파라미터를 찾은 뒤 이걸로 재학습시킴. -최상의 모델 점수는 best_score_ -이 모델의..
Software Development Process(19.09.12~ https://pabi.smartlearn.kr/courses/course-v1:POSTECH+DSC511+G902/course/ 코스 | DSC511 | SmartLearn 자기주도적 학습플랫폼 Copyright@2019 포항공과대학교. ALL RIGHTS RESERVED. pabi.smartlearn.kr 프로그래밍 개발 방법론
[4강] 좋은 훈련 세트 만들기 : 데이터 전처리 1. 누락된 데이터 제거.대체하기 일반적으로 누락된 값은 NaN이나 NULL으로 채워짐. (1)누락된 데이터 확인하기 : .isnull 메서드: 셀이 수치값을 담고 있다면 0 누락되어있다면 1이 채워진 DataFrame을 반환. 데이터프레임.isnull() (2)누락된 데이터 제외 dropna 메서드: df.dropna(axis=0/1) # 0:행삭제 1:열삭제 df.dropna(how='all') # 모든 열이 NaN일 때만 행을 삭제합니다. df.dropna(thresh=4) # 실수 값이 4개보다 작은 행을 삭제합니다 df.dropna(subset=['C']) #특정 열에 NaN이 있는 행만 삭제합니다(여기서는 ‘C’열). (3)누락된 값 대체 Imputer 클래스 -평균으로 대체함 Imputer(..
[T아카데미] Scikit-Learn으로 다지는 머신러닝 기초 https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=158
머신러닝을 위한 python 워밍업 1강 https://www.edwith.org/aipython/lecture/22951/ [LECTURE] Overview : edwith Pythonic Code Overview 학습 목표 Pythonic Code는 간단하게, 다른 사람의 코드를 잘 이해하기 위해서 파이썬 특유의 문법을 활용하여 효율적으로 코드를... - 커넥트재단 www.edwith.org Split & Join 문자열을 나누고 합친다. colors1 = ['red','blue','yellow','green'] result1 = '' for s in colors1: result1 += s result1 >>'redblueyellowgreen' 이렇게 해도 되지만... 더 짧게 코딩할 수도 있다! 바로... .join() 을 이용해서! ''..
배열과 구조체 구조체란? -사용자 정의 자료형 User-difinded data types 기본 자료형: 프로그래밍 언어에서 기본적으로 제공하는 자료형. (int float, double, char 등) 사용자 정의 자료형: 일상생활에 다양한 형태의 문제를 해결하기 위해서는 기본 자료형만으로는 자료의 선언과 저장에 한계가 있으므로, 해결하려는 문제와 가장 가까운 자료구조를 사용자(프로그래머)가 직접 자료형으로 만들어서 문제를 해결할 수 있는 자료형. (구조체 struct 등) -구조체 정의 구조체의 필요성: 동일한 자료형의 데이터가 여러 개 필요한 경우에 배열을 사용하여 처리할 수 있지만, 성적처리와 같이 학번, 점수, 학점 등 서로 다른 자료형을 가진 데이터를 함께 저장하고 처리하기 위해서는 새로운 자료형이 필요하다..
배열과 함수 *캡쳐 화면은 gsit postech에서 제공하는 윤은영 교수님의 컴퓨터 공학 입문(https://pabi.smartlearn.kr/courses/course-v1:POSTECH+DSC104+P903/about) 강의 내용임을 밝힙니다. 배열이란? -배열의 필요성: 동일한 자료형의 데이터가 여러 개 필요한 경우 변수를 하나씩 선언하여 사용할 수 있지만, 성적 처리와 같이 많은 자료를 처리해야 할 때는 하나씩 선언하는 것보다 여러 개를 한번에 선언하고 각각의 데이터에 접근하여 처리할 수 있는 방법이 필요. -배열: 동일한 자료형의 데이터가 여러 개 연속적으로 저장되어 있는 데이터 저장 장소. int score [5]; 자료형 배열이름 배열크기 (1) 초기화 int score [5] = {1,2,3,4,5}..
파일 입출력과 함수 파일 입출력 처리 순서 1. 파일 연결 1.1. 파일의 주소를 저장할 수 있는 파일 포인터 변수 선언 1.2. FILE* inData, outData FILE 데이터 타입- 구조체에 가서 설명됨. 파일의 주소를 저장할 수 있는 파일 포인터 변수를 선언할 때 사용할 수 있는 데이터 타입. 2. 파일 열기 2.1. fopen() 함수 사용 fopen() 라이브러리 함수. stdio.h에 함수의 원형이 포함되어 있음. 함수: 독립적으로 수행할 수 있는 프로그램 단위. 3.파일의 데이터 읽어 오기 3.1. fscanf() 함수 사용 fscanf() 내 소스코드에 있는 변수에 저장해주세요라는 뜻. 4. 읽어온 데이터로 성적 처리 4.1. if, else 등의 명령어 사용 5. 파일 닫기 5.1. fclose() ..