머신러닝 이해 (하이퍼 파라미터 , 머신 학습방법)

하이퍼 파라미터에서 n_estimators값이 무조건 크다고 좋은게 아닌 이유는 과 학습이 되어 버리면

어떤 특정 케이스에 대해 답을 찍어버림. 따라서 어떤 모델의 질문과 예측에 의한 결과가 아니라 해당 case에 대한

결과 값으로 값을 내어 버리기 때문에 오히려 성능이 떨어질 수 있음.

우리가 사용하는 데이터의 속성들 즉 칼럼 정보에 대해서 결과를 도출 하는 과정에 대해 질문을 던짐. 그 과정에 분류하고 일정한 규칙과 경향이 생기는데 , 하이퍼 파라미터 설정이유는 default가 만약 1개의 트리라면 하나의 트리로는 많은 질문을 던질 수도 그리고 분류하는 그 체계 또한 한정적임. 딱 1set에 대한 정보임 . 따라서 트리가 많아 질수록 좀 더 분류가 많아지고 정확한 정보에 가까워짐. 하지만 위에서 말했듯이 과학습이 되면 안됨.

'AI > Kaggle' 카테고리의 다른 글

San Francisco Crime Classification 2일차 (0)	2019.09.24
San Francisco Crime Classification 1일차 (0)	2019.09.17
kaggle 그림으로 데이터 분석 (0)	2019.09.10
Store Item Demand Forecasting Challenge 2회차 (0)	2019.09.10
Bike Sharing Demand (2) 성능 개선 2회차 (0)	2019.09.06

이무쿤의 코딩일지

머신러닝 이해 (하이퍼 파라미터 , 머신 학습방법)

'AI > Kaggle' 카테고리의 다른 글

티스토리툴바

머신러닝 이해 (하이퍼 파라미터 , 머신 학습방법)

'AI > Kaggle' 카테고리의 다른 글

'AI/Kaggle' Related Articles

티스토리툴바