320x100
320x100
데이터 프레임에서 각 column별 고유값의 개수를 구하기 위해서는 value_counts() 함수를 이용하면 됩니다.
value_counts()는 어떤 컬럼/Seires의 uniqu 한 value 들을 count 해주는 함수 입니다.
value_count() 함수를 이용하면 출력값 으로 인덱스가 unique value로 값은 count가 들어가 있는 Series가 출력 됩니다.
예를 들어 데이터프레임(df) 에서 category 라는 컬럼이 있다면 df['category'].value_counts() 로 category 컬럼의 고유값의 개수를 출력 할 수 있습니다.
보통 value_counts() 함수는 데이터에서 label 값들의 비율을 확인 할 때 많이 사용합니다.
import pandas as pd
train = pd.read_csv('data/train.csv')
train['category'].value_counts()
320x100
320x100
'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글
텍스트 데이터 전처리 개요 (0) | 2021.11.03 |
---|---|
데이터 기본 정보 보기(info()) (0) | 2021.11.02 |
데이터 결측치 확인하기 - (isnull().sum()) (0) | 2021.10.31 |
데이터 확인하기 - (head(),tail()) (0) | 2021.10.30 |
index=False, 데이터를 저장할 때 index 제외하고 저장 (0) | 2021.10.29 |