320x100
320x100
pivot table로 데이터 집계하기
- group by로 작업했던 것을 pivot table로 똑같이 해봅니다.
df_last.pivot_table(index='지역명',values='평당분양가격')
전용면적당 평당분양가격 평균
df_last.groupby(["전용면적"])["평당분양가격"].mean()
전용면적을 index 로 평당분양가격 을 values 로 구합니다.
df_last.pivot_table(index="전용면적",values="평당분양가격")
지역명, 전용면적으로 평당분양가격의 평균을 구합니다.
df_last.pivot_table(index="전용면적",columns="지역명",values="평당분양가격").astype(int)
연도, 지역명으로 평당분양가격의 평균을 구합니다.
df_last.pivot_table(index="연도",columns="지역명",values="평당분양가격").astype(int)
Seaborn 으로 시각화 해보기
라이브러리 로드하기
import seaborn as sns
sns.set_style("darkgrid",rc={"font.family":"Malgun Gothic"})
barplot으로 지역별 평당분양가격을 그려봅니다.
plt.figure(figsize=(10,4))
sns.barplot(data=df_last,x="지역명",y="평당분양가격")
barplot으로 연도별 평당분양가격을 그려봅니다.
sns.barplot(data=df_last,x="연도",y="평당분양가격",ci=None)
catplot 으로 서브플롯 그리기
sns.catplot(data=df_last,x="연도",y="평당분양가격",kind="bar",ci=None,hue="지역명",col="지역명",col_wrap=4)
lineplot으로 연도별 평당분양가격을 그려봅니다.
- hue 옵션을 통해 지역별로 다르게 표시해 봅니다.
plt.figure(figsize=(10,6))
sns.lineplot(data=df_last,x="연도",y="평당분양가격",hue="지역명",ci=None)
relplot 으로 서브플롯 그리기
sns.relplot(data=df_last,x="연도",y="평당분양가격",hue="지역명",kind="line",col="지역명",col_wrap=4,ci=None)
연도별 평당분양가격을 boxplot으로 그려봅니다.
sns.boxplot(data=df_last,x="연도",y='평당분양가격')
# hue옵션을 주어 전용면적별로 다르게 표시해 봅니다.
sns.boxplot(data=df_last,x="연도",y='평당분양가격',hue="전용면적")
연도별 평당분양가격을 violinplot으로 그려봅니다.
sns.violinplot(data=df_last,x="연도",y='평당분양가격')
연도별 평당분양가격을 swarmplot 으로 그려봅니다.
- swarmplot은 범주형(카테고리) 데이터의 산점도를 표현하기에 적합합니다.
sns.swarmplot(data=df_last,x="연도",y='평당분양가격',size=1)
320x100
320x100
'빅데이터 관련 자료 > Python' 카테고리의 다른 글
전국 신규 민간 아파트 분양가격 동향 데이터 분석 - (4) (0) | 2022.01.18 |
---|---|
전국 신규 민간 아파트 분양가격 동향 데이터 분석 - (3) (0) | 2022.01.16 |
전국 신규 민간 아파트 분양가격 동향 데이터 분석 - (1) (0) | 2022.01.14 |
파이썬 기초용어 정리 - 제어문, 입출력 etc (0) | 2022.01.05 |
Python 기초 용어 정리 - 자료형 (0) | 2022.01.04 |