320x100
import
필요한 라이브러리를 로드
import pandas as pd
import numpy as np
import seaborn as sns
DataFrame
행과 열로 구성된 비어있는 데이터프레임을 생성
df = pd.DataFrame()
df
컬럼 추가하기
df["자동차"]=["소형차", "중형차", "대형차", "소형차", "대형차", "중형차"]
df["가격"]=[3000, 5000, 7000, 4000, 9000, 7000]
df["가격"] #series형태
df[["가격"]] #dataframe 형태
tolist()
가격 컬럼전체를 리스트 형태로 변경합니다.
df["가격"].tolist()
컬럼값 변경하기
df.columns=['차종류','시세']
데이터 요약하기
df.info() # 해당 열에 숫자랑 문자가 섞여있으면 Dtype은 object
df.shape # 데이터 프레임의 크기를 출력
df.dtypes # 데이터의 타입 보기
df.describe() #수치형 데이터프레임의 요약정보
df.describe(include='object) #범주형 데이터프레임의 요약정보
2개 이상의 컬럼명 가져오기
두개 이상 칼럼을 가져오기 위해서 [] 대괄호를 두번 사용하여야 한다.
df[['차종류','시세']]
행을 기준으로 데이터 가져오기
- 인덱스 번호로 첫번째 데이터 가져오기
df.loc[0]
df.loc[[0,1,2]]
행과 열을 함께 가져오기
loc[행 인데스, 열 인데스]
행과 열 각각의 인데스에 맞는 값을 가져온다.
df.loc[0,"차종류"]
df.loc[[1,2],["차종류","시세"]]
특정차 종류만 가져오기
파이썬의 정규표현식에서는 |는 or를 &는 and를 의미
여러 검색어로 검색을 한다 가정하고 | 로 검색어를 넣어준다고 생각
str.contains 를 사용해서 차종류를 가져올 수 있다.
df[df['차종류'].str.contains('소')]
df[df['차종류'].str.contains('소|대')]
가격이 특정 금액 이상인 것만 가져옵니다.
df[df["시세"]>3500]
정렬하기
df.sort_values(["차종류","시세"],ascending=[True,False])
파일로 저장하기
df.to_csv("판다스연습.csv", index=False)
320x100
320x100
'빅데이터 관련 자료 > Python' 카테고리의 다른 글
파이썬 기초 - 6 (0) | 2021.08.02 |
---|---|
파이썬 기초 - 5 (0) | 2021.07.29 |
파이썬 기초-3 (0) | 2021.07.22 |
파이썬 기초 - 2 (0) | 2021.07.21 |
파이썬 기초 - 1 (0) | 2021.07.20 |