Lv4 | 전처리 | Polynomial Features (1)
Data Analyst

빅데이터 관련 자료/Dacon

Lv4 | 전처리 | Polynomial Features (1)

carpe08 2021. 9. 10. 14:06
320x100
320x100

이전에는 연속형 데이터를 범주형 데이터로 변환 시키는 방법으로 변수를 추가헀다면, 요번에는 Polynomial Features라는 라이브러리에 대해 알아보도록 하겠다.

 

Polynomial Features 라이브러리는 sklearn 에 내장되어 있는 라이브러리이다.

 

Polynomial Features 라이브러리를 이용하면 현재 데이터를 다항식 형태로 변환 시킬 수 있다.

 

데이터에 x1, x2변수가 있다하면 PolynomialFeatures 라이브러리를 이용해

1. x1, x2, x1^2, x1*x2, x2^2로 간단하게 변환 시킬 수 있다.

# 임의 데이터 생성

X = np.arrange(6).reshape(3,2)

df = pd.DataFrame(X)
df.columns = ['x_1','x_2']

poly_features = PolynomialFeatures(degree=2) # 차원은 2로 설정
df_poly = poly_features.fit_transform(df) # fit_transform 메소드를 통해 데이터 변환
df_poly = pd.DataFrame(df_poly) # PolynomialFeatures로 변환 된 데이터를 데이터 프레임 형태로 변환

df_poly.columns= ['1','x1','x2','x1^2','x1*x2','x2^2'] #df_poly의 컬럼을 1,x1,x2,x1^2,x1*x2,x2^2로 변경
df_poly

 

 

 

320x100
320x100