XGBoost 튜닝

빅데이터 관련 자료/Dacon

XGBoost 튜닝

carpe08 2021. 9. 28. 19:07

320x100

이번 시간에는 Bayesian Optimization을 이영헤 XGBoost 모델을 튜닝해보도록 하겠다.

튜닝에 앞서 XGBoost의 하이퍼 파라미터를 알아보겠다.

learning rate 기본값:0.3
- learning reate가 높을 수록 과적합하기 쉽다.

subsample 기본값:1
- weak learner가 학습에 사용하는 데이터 샘플링 비율이다.
- 보통 0.5 ~ 1 사용된다.
- 값이 낮을수록 과적합이 방지된다.

n_estimator 기본값:100
- 생성할 weak learner 수
- learning rate가 낮을 때, n_estimator를 높여야 과적합이 방지된다.

max_depth 기본값:6
- 트리의 maximum depth이다
- 적정한 값이 제시되어야 하고 보통 3~10 사이 값이 적용된다.
- max_depth가 높을수록 모델의 복잡도가 커져 과적화하기 쉽ek

gamma 기본값:0
- leaf node의 추가분할을 결정할 최소손실 감소값이다.
- 해당값보다 손실이 크게 감소할때 분리한다.
- 값이 높을수록 과적합이 방지된다.

colsample_bytree 기본값:1
- 각 tree별 사용된 feature의 퍼센테이지이다
.- 보통 0.5~1 사용된다.
- 값이 낮을수록 과적합이 방지된다.

lambda 기본값:1
- 가중치에 대한 L2 Regularization 적용 값
- 피쳐 개수가 많을 떄 적용을 검토
- 이 값이 클수록 과적합 감소 효과

alpha 기본값:0
- 가중치에 대한 L1 Regularization 적용 값
- 피쳐 개수가 많을 떄 적용을 검토
- 이 값이 클수록 과적합 감소 효과

320x100

저작자표시

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

정형 데이터 분석 파이프 라인 (1) (0)	2021.10.12
XGBoost 튜닝 - 2 (0)	2021.09.29
Bayesian Optimization 실습 (0)	2021.09.27
Bayesian Optimization 복습 (0)	2021.09.27
Voting Classifier 실습 (0)	2021.09.23

현재글XGBoost 튜닝

현업 데이터 분석가의 실무 및 일상 Story

250x250

SQL, 데이터분석, 데이터 분석, html 기초, hackerrank, lgbm, hadoop, 파이썬 기초, 다중공선성, KSQL, Oracle SQL, 머신러닝, PySpark, 파이썬, 해커랭크, 하이퍼파라미터, 데이콘, train_test_split, Python, kubernetes,

Today :
Yesterday :

이서

XGBoost 튜닝

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

'빅데이터 관련 자료/Dacon'의 다른글

티스토리툴바

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

XGBoost 튜닝

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

'빅데이터 관련 자료/Dacon'의 다른글

관련글

티스토리툴바