unique value 값 개수 출력(value_counts()
Data Analyst

빅데이터 관련 자료/Dacon

unique value 값 개수 출력(value_counts()

carpe08 2021. 11. 1. 02:25
320x100
320x100

데이터 프레임에서 각 column별 고유값의 개수를 구하기 위해서는 value_counts()  함수를 이용하면 됩니다.

value_counts()는 어떤 컬럼/Seires의 uniqu 한 value 들을 count 해주는 함수 입니다.

value_count() 함수를 이용하면 출력값 으로 인덱스가 unique value로 값은 count가 들어가 있는 Series가 출력 됩니다.

 

예를 들어 데이터프레임(df) 에서 category 라는 컬럼이 있다면 df['category'].value_counts() 로 category 컬럼의 고유값의 개수를 출력 할 수 있습니다.

 

보통 value_counts() 함수는 데이터에서 label 값들의 비율을 확인 할 때 많이 사용합니다.

import pandas as pd

train = pd.read_csv('data/train.csv')

train['category'].value_counts()
320x100
320x100