Python 함수 group by, unstack() , transpose()
Data Analyst

빅데이터 관련 자료/Python

Python 함수 group by, unstack() , transpose()

carpe08 2023. 2. 2. 15:31
320x100
320x100

unstack() 

group by 를 사용하고 unstack() 을 이용하여 컬럼을 가져올 수 있다.

group by 하는 컬럼 중

예를 들어, ["A","B"]라고 한다면,

끝에있는 index B를 컬럼으로 가지고 온다.

 

실제 데이터로 확인해보자

지역별 평당 분양가격 데이터이다.

여기서 지역명, 전용면적으로 평당분양가격의 평균을 구하고자 하면, 아래 코딩과 같다.

df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean()

하지만, 컬럼으로 된 데이터로 확인하고 싶을 때, unstack() 을 사용한다.

df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean().unstack()

더 깔끔하다.

아까 처음에 ["A","B"]라고 한다면, 끝에있는 index B를 컬럼으로 가지고 온다고 했는데

데이터를 확인해보면 전용면적을 컬럼으로 가져오는것을 확인할 수 있다.

 

transpose

 행과 열을 변경하고 싶다면 transpose()를 사용한다.

예를 들어 연도, 지역명으로 평당분양가격의 평균을 구합니다.

unstack()을 사용한다면, 컬럼이 마지막 인덱스인 B, 즉 지역명이 올것이다.

여기서 transpose() 를 사용한다면, 연도가 컬럼으로 온다.

g = df_last.groupby(["연도","지역명"])["평당분양가격"].mean().unstack()
g.transpose()

320x100
320x100