AI
훈련 노하우 - 교차 검증을 알아보고 사이킷런으로 수행
교차 검증(cross validation) 전체 데이터 세트의 샘플 개수가 많지 않을 때 검증 세트를 훈련 세트에서 분리하느라 훈련 세트의 샘플 개수가 줄어들어 모델을 훈련시킬 데이터가 부족해지는 경우 훈련 세트를 작은 덩어리로 나누고 이 작은 덩어리를 '폴드'라고 부른다. 8:2로 나누고 8에 해당하는 훈련 세트 다시 5개 작은 덩어리로 나눈다. 그 후 작은 덩어리를 1번씩 검증에 사용하고 나머지 덩어리를 훈련에 사용 교차 검증 과정 훈련 세트를 k개의 폴드(fold)로 나눈다. 첫 번째 폴드를 검증 세트로 사용하고 나머지 폴드(k-1)를 훈련 세트로 사용한다. 모델을 훈련한 다음에 검증 세트로 평가한다. 차례대로 다음 폴드를 검증 세트로 사용해 반복한다. k개의 검증 세트로 k번 성능을 평가한 후 계..
2020. 11. 27. 12:20
최근댓글