320x100
320x100
EDA의 첫 번쨰 순서로 가장 기본적인 데이터 불러오기, 데이터 정보 관측하기, 데이터 크기 파악하기, 데이터 피쳐 알아보기를 진행한다.
CSV 파일을 pandas DataFrame class로 불러오기 위해 read_csv() 메서드를 활용할 수 있다.
df = pd.read_csv(‘경로')
info() 메서드를 활용하여 데이터의 피쳐수와 컬럼명, 결측치여부, dtype에 대한 정보를 알 수 있다.
df.info()
shape attribute를 쓰면 데이터의 행갯수, 열갯수를 출력하여 데이터의 크기를 파악할 수 있다.
df.shape
head() 메서드를 통해 데이터의 대략적인 정보를 알 수 있다.
df.head()
320x100
320x100
'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글
Lv3 | EDA | 수치데이터 특성 보기 (describe()) (0) | 2021.08.12 |
---|---|
Lv3 | EDA | 결측치 유무 확인하기 isnull().sum() (0) | 2021.08.11 |
Lv2 | 튜닝 | 하이퍼파라미터, GridSearch 개념 (정지규칙) (0) | 2021.08.09 |
Lv2 | 튜닝 | 변수 제거 (drop()) (0) | 2021.08.08 |
Lv2 | 튜닝 | 랜덤포레스트 변수중요도 확인 (feature_importances_) (0) | 2021.08.07 |