회귀 모델 평가 지표 정리
잡학다식의 지식공방

IT/Machine Learning

회귀 모델 평가 지표 정리

carpe08 2025. 5. 6. 14:39
320x100

분류 모델과 달리 회귀 모델은 연속적인 값을 예측하기 때문에, 그 성능을 평가할 때는 다른 지표를 사용합니다. 이번 글에서는 회귀 문제에서 가장 자주 사용되는 평가 지표인 MAE, MSE, RMSE, R² (결정 계수)에 대해 설명합니다.


1. MAE (Mean Absolute Error, 평균 절대 오차)

정의: 실제값과 예측값 사이의 절대 오차의 평균

공식:

MAE = (1/n) * Σ |yᵢ - ŷᵢ|

특징:

  • 직관적이고 해석이 쉬움
  • 이상치에 덜 민감함
  • 단위가 원래 데이터와 동일함

2. MSE (Mean Squared Error, 평균 제곱 오차)

정의: 오차를 제곱한 값의 평균

공식:

MSE = (1/n) * Σ (yᵢ - ŷᵢ)²

특징:

  • 큰 오차에 더 큰 패널티 부여 (이상치에 민감)
  • 미분 가능해 수학적으로 다루기 쉬움

3. RMSE (Root Mean Squared Error, 평균 제곱근 오차)

정의: MSE에 루트를 씌운 값 (원래 단위로 환원)

공식:

RMSE = sqrt(MSE)

특징:

  • MSE의 단위 문제를 보완
  • 해석 용이성이 높음

4. R² (결정 계수, Coefficient of Determination)

정의: 모델이 전체 변동성 중 얼마나 설명하는지를 나타냄

공식:

R² = 1 - (Σ(yᵢ - ŷᵢ)² / Σ(yᵢ - ȳ)²)
  • ŷᵢ: 예측값
  • ȳ: 실제값의 평균

특징:

  • 0 ~ 1 사이 값 (1에 가까울수록 좋음)
  • 음수가 나올 수도 있음 (무작위 예측보다도 못한 경우)
  • 설명력 해석에 유용

지표별 비교 요약

지표 특징 민감도 해석 용이성 단위 문제

MAE 절대 오차 평균 낮음 높음 없음
MSE 제곱 오차 평균 높음 중간 단위 변경됨
RMSE MSE의 제곱근 높음 높음 해결됨
설명력 측정 (0~1) 중간 매우 높음 무관

결론

회귀 모델을 평가할 때는 단순히 하나의 지표만 보는 것보다, 여러 지표를 함께 해석하는 것이 중요합니다. MAE는 직관적이고 안정적이며, RMSE는 큰 오차에 민감한 반면, R²는 모델이 얼마나 잘 설명하는지를 알려줍니다. 분석 목적에 맞게 적절한 지표를 선택하세요.


https://link.coupang.com/a/cpQy6K

 

머신 러닝 교과서 with 파이썬 사이킷런 텐서플로 개정 3판 - 클라우드/빅데이터 | 쿠팡

쿠팡에서 머신 러닝 교과서 with 파이썬 사이킷런 텐서플로 개정 3판 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 클라우드/빅데이터 제품도 바로 쿠팡에서 확인할 수 있습니다.

www.coupang.com

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

 

320x100
320x100