728x90
반응형

오차 행렬(confusion matrix, 혼동 행렬)

  • 학습된 분류 모델이 예측을 수행하면서 얼마나 헷갈리고 있는지도 함께 보여주는 지표

 

[그림1] 오차 행렬 출처 : https://rueki.tistory.com/66

  • TN, FP, FN, TP는 예측 클래스와 실제 클래스의 Positive 결정 값(값 1)과 Negative 결정 값(값 0)의 결합에 따라 결정된다.
  • TN은 예측값을 Negative 값 0으로 예측했고 실제 값 역시 Negative 값 0
  • FP는 예측값을 Positive 값 1로 예측했는데 실제 값은 Negative 값 0
  • FN은 예측값을 Negative 값 0으로 예측했는데 실제 값은 Positive 값 1
  • TP는 예측값을 Positive 값 1로 예측했는데 실제 값 역시 Positive 값 1

TP, TN, FP, TN값을 조합해 Classifier의 성능을 측정할 수 이쓴ㄴ 주요 지표인 정확도(Accuracy), 정밀도(Precision), 재현율(Recall)값을 알 수 있다.

 

정확도 = 예측 결과와 실제 값이 동일한 건수 / 전체 데이터 수 = (TN+TP) / (TN + FP + FN + TP)

 

일반적으로 불균형한 레이블 클래스를 가지는 이진 분류 모델에서는 많은 데이터 중에서 중점적으로 찾아야 하는 매우 적은 수의 결괏값에 Positive를 설정해 1값을 부여하고, 그렇지 않은 경우는 Negative로 0값을 부여하는 경우가 많다.

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기