已修改

精确率、召回率、真正类率(TPR)、假正类率(FPR)ROC曲线

针对二分类问题。


精确率 = TP / (TP + FP),表示返回的正例中真正例所占的比例;
召回率 = TP / (TP + FN),表示返回的真正例占所有正例的比例。
真正类率(TPR),TPR = TP / (TP + FN),返回的正类占所有正类的比例;(没错,跟召回率一个公式)TPR越大越好。
假正类率(FPR),FPR = FP / (FP + TN),返回的负类占所有负类的比例。FPR越小越好
ROC curve:FPR越小越好。

对于ROC来说,横坐标就是FPR,而纵坐标就是TPR,因此可以想见,当 TPR越大,而FPR越小时,说明分类结果是较好的。

AUC:
AUC 即ROC曲线下的面积,计算方式即为ROC Curve的微积分值,其物理意义可以表示为:随机给定一正一负两个样本,将正样本排在负样本之前的概率,因此AUC越大,说明正样本越有可能被排在负样本之前,即分类的结果越好。

ROC的总结:

  1. ROC 可以反映二分类器的总体分类性能,但是无法直接从图中识别出分类最好的阈值,事实上最好的阈值也是视具体的场景所定;
  2. ROC Curve 对应的AUC越大说明分类性能越好;
  3. ROC曲线一定是需要在 y = x之上的,否则就是一个不理想的分类器;