stratified k-fold 실습
Data Analyst

빅데이터 관련 자료/Dacon

stratified k-fold 실습

carpe08 2021. 9. 19. 13:46
320x100
320x100

지난 시간에 Stratified K-fold 개념에 대해 배웠다.
Stratified K-fold란, K-fold의 문제점인 target 데이터의 비율을 일정하게 유지하며, 교차 검증을 진행하는 것이다.

이번 시간에는 stratified k-fold와 Light GBM 을 이용해 와인 품질 분류를 실습해보도록 하겠다.

# Stratified K-folde라이브러리를 이용해 5개의 fold로 나눔

skt = StrarifiedKFold(n_splits=5)

X = tarin_onde.drop('quality',axis=1)
y = train['quality']
cnt = 1
acc = 0

for train_idx, valid_idx in skf.split(X,y):
    train_data = train.iloc[train_idx]
    valid_data = valid.iloc[valid_idx]

# 모델 정의

model = LGBMClassifier()

#train_X는 train_data 에서 quality를 제외한 모든 변수
#train_y는 train_data['quality']

#fit 메소드를 이용해 모델 학습
model.fit(train_X, train_y)

valid_X = valid_data.drop('quality',axis=1)
valid_y = valid_data['quality']

#predict 메소드와 valid_X 데이터를 이용해 품질 예측
pred = model.predict(valid_X)

#모델 정확도 출력
print(cnt,"번째 모델 정확도:",accuracy_score(pred,valid_y)
acc + = accuracy_score(pred,valid_y)
cnt + = 1

print('모델 정확도 평균:',acc/5)
320x100
320x100

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

Voting Classifier 실습  (0) 2021.09.23
Voting Classifier 정의  (0) 2021.09.22
stratified k-fold 란 ?  (0) 2021.09.18
Light GBM 실습  (0) 2021.09.17
LGBM 개념  (0) 2021.09.16