파이썬 기초 - 4
잡학다식의 지식공방

빅데이터 관련 자료/Python

파이썬 기초 - 4

carpe08 2021. 7. 26. 19:59
320x100

import

필요한 라이브러리를 로드

import pandas as pd
import numpy as np
import seaborn as sns

DataFrame

행과 열로 구성된 비어있는 데이터프레임을 생성

df = pd.DataFrame()
df

 


컬럼 추가하기

df["자동차"]=["소형차", "중형차", "대형차", "소형차", "대형차", "중형차"]
df["가격"]=[3000, 5000, 7000, 4000, 9000, 7000]

df["가격"] #series형태
df[["가격"]] #dataframe 형태

tolist()

 

가격 컬럼전체를 리스트 형태로 변경합니다. 

df["가격"].tolist()

컬럼값 변경하기

 

df.columns=['차종류','시세']

데이터 요약하기

df.info() # 해당 열에 숫자랑 문자가 섞여있으면 Dtype은 object
df.shape # 데이터 프레임의 크기를 출력
df.dtypes # 데이터의 타입 보기
df.describe() #수치형 데이터프레임의 요약정보
df.describe(include='object) #범주형 데이터프레임의 요약정보

2개 이상의 컬럼명 가져오기

두개 이상 칼럼을 가져오기 위해서 [] 대괄호를 두번 사용하여야 한다.

df[['차종류','시세']]

 


 행을 기준으로 데이터 가져오기

- 인덱스 번호로 첫번째 데이터 가져오기

df.loc[0]

df.loc[[0,1,2]]


행과 열을 함께 가져오기

loc[행 인데스, 열 인데스]

행과 열 각각의 인데스에 맞는 값을 가져온다.

df.loc[0,"차종류"]

df.loc[[1,2],["차종류","시세"]]


특정차 종류만 가져오기

파이썬의 정규표현식에서는 |는 or를 &는 and를 의미
여러 검색어로 검색을 한다 가정하고 | 로 검색어를 넣어준다고 생각
str.contains 를 사용해서 차종류를 가져올 수 있다.

df[df['차종류'].str.contains('소')]

df[df['차종류'].str.contains('소|대')]


가격이 특정 금액 이상인 것만 가져옵니다.

df[df["시세"]>3500]

정렬하기

df.sort_values(["차종류","시세"],ascending=[True,False])

파일로 저장하기

df.to_csv("판다스연습.csv", index=False)
320x100
320x100

'빅데이터 관련 자료 > Python' 카테고리의 다른 글

파이썬 기초 - 6  (0) 2021.08.02
파이썬 기초 - 5  (0) 2021.07.29
파이썬 기초-3  (0) 2021.07.22
파이썬 기초 - 2  (0) 2021.07.21
파이썬 기초 - 1  (0) 2021.07.20