본문 바로가기

성능 지표

(2)
회귀 모델에 대한 성능 평가 지표들 MSE (Mean Squared Error) 가장 일반적이고 직관적인 에러 지표. 에러를 제곱하여 평균을 계산하니, 값은 낮을수록 좋다. 장점 지표 자체가 직관적이고 단순하다. 단점 스케일에 의존적이다. 예를 들어, 삼성전자의 주가가 1000000원이고 네이버가 70000원일 때, 두 주가를 예측하는 각각 모델의 MSE 가 똑같이 5000이 나왔을 경우, 분명 동일한 에러율이 아님에도, 동일하게 보여짐. 에러를 제곱하기 때문에, 1미만의 에러는 더 작아지고, 그 이상의 에러는 더 커진다. 즉 값의 왜곡이 있음. RMSE (Root Mean Squared Error) MSE 에 Root 를 씌운 에러 지표. 마찬가지로 값은 낮을수록 좋다. 장단점은 MSE 를 거의 그대로 따른다. 다만, 여기서는 제곱된 에..
분류 모델에 대한 성능 평가 지표들 Precision & Recall Precision 은 모델의 예측 값 중, 실제 값과 같은 데이터의 비율을 말하고, Recall 은 실제 값 중, 모델의 예측 값과 같은 데이터의 비율을 말한다. 다시 정리하면, 예측해야할 값의 클래스가 A, B, C 가 있다고 할 때, Precision = (예측 데이터 중, 실제 클래스 A 인 데이터의 수) / (클래스 A 로 예측된 값들의 데이터 수) Recall = (실제 데이터 중, 클래스 A 로 예측된 값들의 데이터 수) / (실제 클래스 A 인 데이터의 수) 일반적으로 각 클래스 A, B, C 에 대한 각각의 성능 지표를 구한 뒤, 평균을 내어 하나의 지표로 통합하여 표현한다. 평균 외에 다른 방법도 있긴 하다. 이 두 값 모두 0~1 사이의 값을 가지며 1..