XGBoost 실습

빅데이터 관련 자료/Dacon

XGBoost 실습

carpe08 2021. 9. 15. 01:35

320x100

안녕하세요 이번시간에는 XGBoost를 이용해 와인 품질 분류를 진행하도록 하겠다.
XGBoost의 경우 자주 사용했던 Scikit learn 라이브러리에서 기본적으로 제공하지 않는다.
그래서 직접 XGBoost 라이브러리를 설치해 불러와야 한다.

#데이터 확인
train.head()

#원핫 인코딩(pd.get_dummies())
train_one = pd.get_dummies(train)
test_one = pd.get_dummies(test)

#모델 정의
model = XGBClassifier()

#모델 학습
# X는 train에서 quality를 제외한 모든 변수
# y는 train의 quality 변수

# fit 메소드를 이용해 모델 학습
model.fit(X,y)

#predict 메소드와 test_one 데이터를 이용해 품질 예측
pred = model.predict(test_one)

#sample_submission.csv 파일을 불러와 예측된 값으로 채워주기
submission = pd.read_csv('data/sample_submission.csv')
submission['quaulity'] = pred
submission.head()

#정답파일 내보내기
submission.to_csv('xgb_pred.csv',index=False)

320x100

저작자표시

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

Light GBM 실습 (0)	2021.09.17
LGBM 개념 (0)	2021.09.16
XGBoost 개념 (0)	2021.09.14
전처리 복습 - (2) (0)	2021.09.13
전처리 복습 - (1) (0)	2021.09.12

현재글XGBoost 실습

현업 데이터 분석가의 실무 및 일상 Story

250x250

train_test_split, hadoop, 다중공선성, 해커랭크, 하이퍼파라미터, PySpark, 파이썬, SQL, 파이썬 기초, Python, lgbm, hackerrank, kubernetes, 데이터분석, 데이콘, SQL 기초, html 기초, KSQL, 머신러닝, Oracle SQL,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

이서

XGBoost 실습

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

'빅데이터 관련 자료/Dacon'의 다른글

티스토리툴바

XGBoost 실습

'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글

'빅데이터 관련 자료/Dacon'의 다른글

관련글

티스토리툴바