320x100
분류 모델과 달리 회귀 모델은 연속적인 값을 예측하기 때문에, 그 성능을 평가할 때는 다른 지표를 사용합니다. 이번 글에서는 회귀 문제에서 가장 자주 사용되는 평가 지표인 MAE, MSE, RMSE, R² (결정 계수)에 대해 설명합니다.
1. MAE (Mean Absolute Error, 평균 절대 오차)
정의: 실제값과 예측값 사이의 절대 오차의 평균
공식:
MAE = (1/n) * Σ |yᵢ - ŷᵢ|
특징:
- 직관적이고 해석이 쉬움
- 이상치에 덜 민감함
- 단위가 원래 데이터와 동일함
2. MSE (Mean Squared Error, 평균 제곱 오차)
정의: 오차를 제곱한 값의 평균
공식:
MSE = (1/n) * Σ (yᵢ - ŷᵢ)²
특징:
- 큰 오차에 더 큰 패널티 부여 (이상치에 민감)
- 미분 가능해 수학적으로 다루기 쉬움
3. RMSE (Root Mean Squared Error, 평균 제곱근 오차)
정의: MSE에 루트를 씌운 값 (원래 단위로 환원)
공식:
RMSE = sqrt(MSE)
특징:
- MSE의 단위 문제를 보완
- 해석 용이성이 높음
4. R² (결정 계수, Coefficient of Determination)
정의: 모델이 전체 변동성 중 얼마나 설명하는지를 나타냄
공식:
R² = 1 - (Σ(yᵢ - ŷᵢ)² / Σ(yᵢ - ȳ)²)
- ŷᵢ: 예측값
- ȳ: 실제값의 평균
특징:
- 0 ~ 1 사이 값 (1에 가까울수록 좋음)
- 음수가 나올 수도 있음 (무작위 예측보다도 못한 경우)
- 설명력 해석에 유용
지표별 비교 요약
지표 특징 민감도 해석 용이성 단위 문제
MAE | 절대 오차 평균 | 낮음 | 높음 | 없음 |
MSE | 제곱 오차 평균 | 높음 | 중간 | 단위 변경됨 |
RMSE | MSE의 제곱근 | 높음 | 높음 | 해결됨 |
R² | 설명력 측정 (0~1) | 중간 | 매우 높음 | 무관 |
결론
회귀 모델을 평가할 때는 단순히 하나의 지표만 보는 것보다, 여러 지표를 함께 해석하는 것이 중요합니다. MAE는 직관적이고 안정적이며, RMSE는 큰 오차에 민감한 반면, R²는 모델이 얼마나 잘 설명하는지를 알려줍니다. 분석 목적에 맞게 적절한 지표를 선택하세요.
https://link.coupang.com/a/cpQy6K
머신 러닝 교과서 with 파이썬 사이킷런 텐서플로 개정 3판 - 클라우드/빅데이터 | 쿠팡
쿠팡에서 머신 러닝 교과서 with 파이썬 사이킷런 텐서플로 개정 3판 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 클라우드/빅데이터 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
320x100
320x100
'빅데이터 관련 자료 > Machine Learning' 카테고리의 다른 글
혼동 행렬(Confusion Matrix) 해석 (0) | 2025.05.05 |
---|---|
모델 성능 평가 지표 정리 (0) | 2025.05.04 |
머신러닝 vs 딥러닝: 무엇이 다를까? (0) | 2025.05.03 |
앙상블 기법 비교: Bagging vs Boosting (2) | 2025.05.02 |
머신러닝 대표 알고리즘 정리 (1) | 2025.05.01 |