320x100
320x100
UNIT 4-1 Linear Regression
회귀 분석(Linear Regression)
- 어떤 변수들이 한 변수의 원인이 되는지 분석하는 방법
- 인과 관계를 수학적으로 분석하는 것
분류
- 단순 회귀분석: 독립변수가 1개일 때
- 다중 회귀분석: 독립변수가 2개 이상일 때
- 선형 회귀분석: 독립변수와 종속변수의 관계가 선형일 때
- 비선형 회귀분석: 독립변수와 종속변수의 관계가 비선형일 때
선형회귀분석
상관관계: 두 사건이 동시한 일어난 경우, 방향에 따라 양, 음의 상관관계
인과관계: 두 사건이 원인과 결과
실습
UNIT 4-2 Logistic Regression
로지스틱 회귀
독립변수의 선형결합을 이용하여 사건의 발생가능성을 예측하는데 사용되는 통계 기법
회귀를 사용하여 데이터가 어느 카테고리에 속할지 0에서 1사이의 확률 값으로 예측(Regression 탈을 쓴 Classification)
로지스틱 회귀 모델 = 선형회귀모델 + 시그모이드 함수
로짓(Logit) = Log - odds
임계값 설정
암인데 암이 아니라고 하는것과 암이아닌데 암이라고 하는것은 의료적인 측면에서 차이가 크다.
실습
UNIT 4-3 Gradient Boosting Regression
Gradient Boosting Regression
weak model의 ensemble하는 방식 중 하나
회귀 분류 모델 모두 존재하나, 여기서는 회귀문제만을 위해 사용
실습
UNIT 4-4 간단한 타이타닉 생존자 예측
실습
github를 통해 확인
https://github.com/carpe1997/TIL/tree/main/Machine%20Learning/4%ED%9A%8C%EC%B0%A8
320x100
320x100
'빅데이터 관련 자료 > Machine Learning' 카테고리의 다른 글
머신러닝 데이터 분석 6회차 (0) | 2021.09.29 |
---|---|
머신러닝 데이터 분석 5회차 (0) | 2021.09.27 |
머신러닝 데이터 분석 3회차 (0) | 2021.09.13 |
머신러닝 데이터 분석 2회차 (0) | 2021.09.08 |
머신러닝 데이터 분석 1회차 (0) | 2021.09.07 |