머신러닝 데이터 분석 4회차
Data Analyst

빅데이터 관련 자료/Machine Learning

머신러닝 데이터 분석 4회차

carpe08 2021. 9. 17. 21:26
320x100
320x100

UNIT 4-1 Linear Regression

회귀 분석(Linear Regression)

- 어떤 변수들이 한 변수의 원인이 되는지 분석하는 방법

- 인과 관계를 수학적으로 분석하는 것

 

분류

- 단순 회귀분석: 독립변수가 1개일 때

- 다중 회귀분석: 독립변수가 2개 이상일 때

- 선형 회귀분석: 독립변수와 종속변수의 관계가 선형일 때

- 비선형 회귀분석: 독립변수와 종속변수의 관계가 비선형일 때

 

선형회귀분석

상관관계: 두 사건이 동시한 일어난 경우, 방향에 따라 양, 음의 상관관계

인과관계: 두 사건이 원인과 결과

 

실습

 

UNIT 4-2 Logistic Regression

로지스틱 회귀

독립변수의 선형결합을 이용하여 사건의 발생가능성을 예측하는데 사용되는 통계 기법

회귀를 사용하여 데이터가 어느 카테고리에 속할지 0에서 1사이의 확률 값으로 예측(Regression 탈을 쓴 Classification)

로지스틱 회귀 모델 = 선형회귀모델 + 시그모이드 함수

로짓(Logit) = Log - odds

 

임계값 설정

암인데 암이 아니라고 하는것과  암이아닌데 암이라고 하는것은 의료적인 측면에서 차이가 크다.

 

실습

UNIT 4-3 Gradient Boosting Regression

Gradient Boosting Regression

weak model의 ensemble하는 방식 중 하나

회귀 분류 모델 모두 존재하나, 여기서는 회귀문제만을 위해 사용

error에 대해서 학습을 진행한다.

 

 

실습

UNIT 4-4 간단한 타이타닉 생존자 예측

 

실습

github를 통해 확인

https://github.com/carpe1997/TIL/tree/main/Machine%20Learning/4%ED%9A%8C%EC%B0%A8

 

 

320x100
320x100