320x100
320x100
이번시간에는 train_test_split() 으로 데이터셋을 split 하고 해당 데이터 셋을 이용해 모델을 학습하고 검증하는 방법에 대해 알아 보겠습니다.
학습에 사용 할 모델은 Light GBM 입니다
Light GBM 모델을 선언 이후 학습을 위해서는 fit() 메소드를 사용합니다.
이때 fit() 메소드 내부에 다음과 같이 파라미터를 적용해주면 모델이 학습을 하면서 validation 데이터를 이용해 계속 검증을 진행 합니다.
model.fit(x_train, y_train, eval_set = [(x_train,y_train),(x_valid,y_valid)] )
#train_test_split() 메소드를 이용해 train/validation 데이터 나누기
# stratify 옵션을 활용하여 데이터 셋 split
x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'],stratify = train['category'])
# LightGBM을 이용해 학습 및 검증 진행
from lightgbm import LGBMRegressor
model = LGBMRegressor( )
model.fit(x_train,y_train,
eval_set = [(x_train,y_train),(x_valid,y_valid)]
)
output :
[1] training's l2: 0.625523 valid_1's l2: 0.627191
[2] training's l2: 0.591681 valid_1's l2: 0.59452
[3] training's l2: 0.563696 valid_1's l2: 0.567643
[4] training's l2: 0.539629 valid_1's l2: 0.545257
[5] training's l2: 0.519678 valid_1's l2: 0.526837
[6] training's l2: 0.502109 valid_1's l2: 0.509769
[7] training's l2: 0.487098 valid_1's l2: 0.496382
...
[97] training's l2: 0.285291 valid_1's l2: 0.342567
[98] training's l2: 0.284703 valid_1's l2: 0.342394
[99] training's l2: 0.284113 valid_1's l2: 0.342171
[100] training's l2: 0.283486 valid_1's l2: 0.342014
320x100
320x100
'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글
파이썬 파라미터/하이퍼파라미터 (0) | 2021.11.26 |
---|---|
train_test_split / LGBM - (2) (0) | 2021.11.25 |
train_test_split - (4) (0) | 2021.11.23 |
train_test_split() - (3) (0) | 2021.11.22 |
train_test_split() - (2) (0) | 2021.11.21 |