전국 신규 민간 아파트 분양가격 동향 데이터 분석 - (2)
Data Analyst

빅데이터 관련 자료/Python

전국 신규 민간 아파트 분양가격 동향 데이터 분석 - (2)

carpe08 2022. 1. 15. 23:41
320x100
320x100

 

pivot table로 데이터 집계하기

- group by로 작업했던 것을 pivot table로 똑같이 해봅니다.

df_last.pivot_table(index='지역명',values='평당분양가격')

전용면적당 평당분양가격 평균

df_last.groupby(["전용면적"])["평당분양가격"].mean()

전용면적을 index 로 평당분양가격 을 values 로 구합니다.

df_last.pivot_table(index="전용면적",values="평당분양가격")

지역명, 전용면적으로 평당분양가격의 평균을 구합니다.

df_last.pivot_table(index="전용면적",columns="지역명",values="평당분양가격").astype(int)

연도, 지역명으로 평당분양가격의 평균을 구합니다.

df_last.pivot_table(index="연도",columns="지역명",values="평당분양가격").astype(int)

 Seaborn 으로 시각화 해보기

라이브러리 로드하기

import seaborn as sns

sns.set_style("darkgrid",rc={"font.family":"Malgun Gothic"})

barplot으로 지역별 평당분양가격을 그려봅니다.

plt.figure(figsize=(10,4))
sns.barplot(data=df_last,x="지역명",y="평당분양가격")

barplot으로 연도별 평당분양가격을 그려봅니다.

sns.barplot(data=df_last,x="연도",y="평당분양가격",ci=None)

catplot 으로 서브플롯 그리기

sns.catplot(data=df_last,x="연도",y="평당분양가격",kind="bar",ci=None,hue="지역명",col="지역명",col_wrap=4)

lineplot으로 연도별 평당분양가격을 그려봅니다.
 - hue 옵션을 통해 지역별로 다르게 표시해 봅니다.

plt.figure(figsize=(10,6))
sns.lineplot(data=df_last,x="연도",y="평당분양가격",hue="지역명",ci=None)

relplot 으로 서브플롯 그리기

sns.relplot(data=df_last,x="연도",y="평당분양가격",hue="지역명",kind="line",col="지역명",col_wrap=4,ci=None)

 

연도별 평당분양가격을 boxplot으로 그려봅니다.

sns.boxplot(data=df_last,x="연도",y='평당분양가격')

# hue옵션을 주어 전용면적별로 다르게 표시해 봅니다.

sns.boxplot(data=df_last,x="연도",y='평당분양가격',hue="전용면적")

연도별 평당분양가격을 violinplot으로 그려봅니다.

sns.violinplot(data=df_last,x="연도",y='평당분양가격')

연도별 평당분양가격을 swarmplot 으로 그려봅니다. 

 - swarmplot은 범주형(카테고리) 데이터의 산점도를 표현하기에 적합합니다.

sns.swarmplot(data=df_last,x="연도",y='평당분양가격',size=1)

320x100
320x100