IT/Python
파이썬 기초 - 8
carpe08
2021. 11. 12. 22:13
320x100
데이터 개요
Bank Marketing Data Set : https://archive.ics.uci.edu/ml/datasets/bank+marketing
UCI Machine Learning Repository: Bank Marketing Data Set
Bank Marketing Data Set Download: Data Folder, Data Set Description Abstract: The data is related with direct marketing campaigns (phone calls) of a Portuguese banking institution. The classification goal is to predict if the client will subscribe a term d
archive.ics.uci.edu
엑셀에서 피벗테이블을 사용하는 과정
- 값, 행, 열영역에 사용할 칼럼을 드래그&드롭한다.
- 그리고 값 영역을 클릭하여 값필드설정에 들어간다.
- 거기에서 데이터를 요약할 집계함수를 선택한다.
파이썬의 피벗테이블 함수
# pd.pivot_table(데이터프레임, values=’값’, index=’행’, columns=’열’, aggfunc=’집계함수명’)
피벗테이블 함수 다루기
import pandas as pd
import pandas
import matplotlib.pyplot as plt
df=pd.read_csv('bank-additional-full.csv',sep=';')
pd.pivot_table(df,values='duration',index='y',columns='contact',aggfunc='mean')
# 데이터프레임 타입으로 반환
pt_type=pd.pivot_table(df,values='duration',index='y',columns='contact',aggfunc='mean')
type(pt_type)
#output: pandas.core.frame.DataFrame
매개변수 입력없이 피벗테이블 만들기
pd.pivot_table(df,'duration','y','contact','mean')
다중 행 인덱스 설정
pd.pivot_table(df,'duration',['y','poutcome'],'contact','mean')
다중 열 인덱스 설정
pd.pivot_table(df,'duration',['y','poutcome'],['job','contact'],'mean')
결측값 처리
pd.pivot_table(df,'duration',
['y','poutcome'],['job','contact'],
aggfunc='mean',fill_value=0)
320x100
320x100