Light GBM 실습
Data Analyst

빅데이터 관련 자료/Dacon

Light GBM 실습

carpe08 2021. 9. 17. 13:58
320x100
320x100

이번 시간에는 LGBM 을 이용해 와인품질 분류를 진행하겠다.
LGBM의 경우에도 Scikit learn 라이브러리에서 제공하지 않는다. 
XGBoost와 마찬가지로 직접 라이브러리를 설치해 불러와야 한다.

# 데이터 확인
train.head()

# 원핫 인코딩 (pd.get_dummies())
train_one = pd.get_dummies(train)
test_one = pd.get_dummies(test)

# 모델 정의
from lightgbm import LGBMClassifier

model = LGBMClassifier()

# 모델 학습
# X 는 train에서 quality 를 제외한 모든 변수
# y 는 train의 qulity 변수

X = train_one.drop('quality',axis=1)
y = test_one.drop['quality']


# fit 메소드를 이용해 모델 학습

model.fit(X,y)

# predict 메소드와 test_one 데이터를 이용해 품질 예측

pred = model.predict(test_one)

# sample_submission.csv 파일을 불러와 예측된 값으로 채워 주기
submission = pd.read_csv("sample_submission.csv") 
submission['quality'] = pred
submission.head()

# 정답파일 내보내기
submission.to_csv("lgbm_pred.csv",index=False)
320x100
320x100

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

stratified k-fold 실습  (0) 2021.09.19
stratified k-fold 란 ?  (0) 2021.09.18
LGBM 개념  (0) 2021.09.16
XGBoost 실습  (0) 2021.09.15
XGBoost 개념  (0) 2021.09.14