320x100
320x100
lv1에서 결측치들을 0으로 대체하였다.
하지만, 보다 나은 모델 성능을 위해서 결측치를 대체하는 방법은 여러가지 있다.
이번에는 각 피쳐의 평균값으로 대체해보겠다.
원하는 피쳐의 결측치를 해당 피쳐의 평균값으로 대체한다.
df.fillna({'칼럼명':int(df['칼럼명'].mean)},implace=True)
결측치를 갖는 피쳐들을 탐색하고, 해당 피쳐들을 대체하고 나서, 결측치가 남아있는지 확인본다.
df.isnull().sum()
320x100
320x100
'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글
랜덤포레스트 개념, 선언 (RandomForestRegressor()) (0) | 2021.08.05 |
---|---|
결측치 대체 보간법 (0) | 2021.08.04 |
Lv1 | 모델링 | 제출파일생성(to_csv()) (0) | 2021.08.02 |
테스트예측(predict()) (0) | 2021.08.01 |
Lv1 | 모델링 | 모델훈련 (fit()) (0) | 2021.07.31 |