IT/Python
파이썬 기초 - 4
carpe08
2021. 7. 26. 19:59
320x100
import
필요한 라이브러리를 로드
import pandas as pd
import numpy as np
import seaborn as sns
DataFrame
행과 열로 구성된 비어있는 데이터프레임을 생성
df = pd.DataFrame()
df
컬럼 추가하기
df["자동차"]=["소형차", "중형차", "대형차", "소형차", "대형차", "중형차"]
df["가격"]=[3000, 5000, 7000, 4000, 9000, 7000]
df["가격"] #series형태
df[["가격"]] #dataframe 형태
tolist()
가격 컬럼전체를 리스트 형태로 변경합니다.
df["가격"].tolist()
컬럼값 변경하기
df.columns=['차종류','시세']
데이터 요약하기
df.info() # 해당 열에 숫자랑 문자가 섞여있으면 Dtype은 object
df.shape # 데이터 프레임의 크기를 출력
df.dtypes # 데이터의 타입 보기
df.describe() #수치형 데이터프레임의 요약정보
df.describe(include='object) #범주형 데이터프레임의 요약정보
2개 이상의 컬럼명 가져오기
두개 이상 칼럼을 가져오기 위해서 [] 대괄호를 두번 사용하여야 한다.
df[['차종류','시세']]
행을 기준으로 데이터 가져오기
- 인덱스 번호로 첫번째 데이터 가져오기
df.loc[0]
df.loc[[0,1,2]]
행과 열을 함께 가져오기
loc[행 인데스, 열 인데스]
행과 열 각각의 인데스에 맞는 값을 가져온다.
df.loc[0,"차종류"]
df.loc[[1,2],["차종류","시세"]]
특정차 종류만 가져오기
파이썬의 정규표현식에서는 |는 or를 &는 and를 의미
여러 검색어로 검색을 한다 가정하고 | 로 검색어를 넣어준다고 생각
str.contains 를 사용해서 차종류를 가져올 수 있다.
df[df['차종류'].str.contains('소')]
df[df['차종류'].str.contains('소|대')]
가격이 특정 금액 이상인 것만 가져옵니다.
df[df["시세"]>3500]
정렬하기
df.sort_values(["차종류","시세"],ascending=[True,False])
파일로 저장하기
df.to_csv("판다스연습.csv", index=False)
320x100
320x100