320x100
320x100
1️⃣ seaborn pairplot
seaborn의 pairplot은 데이터에 들어 있는 각 컬럼(열)들의 모든 상관 관계를 출력합니다.
3차원 이상의 데이터라면 pairplot 함수를 사용해 분포도를 그리면 손쉽게 모든 변수간의 상관관계를 얻을 수 있습니다.
pairplot은 grid(격자) 형태로 각 집합의 조합에 대해 히스토그램과 분포도를 그립니다.
2️⃣seaborn distplot
seaborn의 distplot 함수는 데이터의 히스토그램을 그려주는 함수입니다.
히스토그램이란 수치형 데이터 분포를 정확하게 표현해주는 시각화 방법입니다.
변수를 여러 개의 bin으로 자르고(사용자 지정) bin당 관측수를 막대그래프로 표현합니다.
3️⃣ 히트맵 (Heat Map)
히트맵은 두개의 범주형(Categorical) 변수에 대한 반응변수의 크기를 색깔의 변화로 표현하는 것입니다.
예를 들어, 일 별 기온을 보고자 할때 , 매일 온도를 히트맵으로 표현하여 온도 변화의 추이를 볼 수도 있습니다.
데이터 분석 과정에서는 변수별 상관관계를 확인 할때 히트맵 그래프를 많이 사용합니다.
320x100
320x100
'빅데이터 관련 자료 > Dacon' 카테고리의 다른 글
Lv4 | 전처리 | 다중공선성 해결 - PCA (1) (0) | 2021.09.05 |
---|---|
Lv4 | 전처리 | 다중공선성 해결 | 변수 정규화 (0) | 2021.09.02 |
Lv4 | EDA | 다중공선성 VIF(분산 팽창 요인) (0) | 2021.08.31 |
Lv4 | EDA | seaborn |다중공선성 Scatter plot (0) | 2021.08.30 |
Lv4 | EDA | 2/5 | seaborn distplot (0) | 2021.08.28 |