0
查准率和查全率是一对矛盾的度量,一般来说,查准率越高时,查全率往往偏低;而查全率高时查准率往往偏低。 在很多情况下,我们可以根据学习器的预测结果对样例进行排序,排在前面的是学习器认为“最可能”是正例的样本,排在最后面的则是学习器认为“最不可能”是正例的样本。按此顺序逐个把样本作为正例进行预测,则每次可以计算出当前的查全率、查准率。以查准率为纵轴、查全率为横轴作图,就得到了查准率-查全率曲线,简称“P-R曲线” P-R图直观地显示出学习器在样本总体上的查全率、查准率。在进行比较时,若一个学习器的P-R曲线被另一个学习器的曲线完全包住,则可断言后者的性能优于前者。例如上图中A的性能明显优于C,但是如果两个学习器的P-R曲线发生了交叉,则难以一般性断言两者孰优孰劣,只能在具体的查准率或者查全率条件下进行比较。 如果仍然希望对A和B进行比较,其中一个合理的依据就是比较P-R曲线下面积的大小,这个面积在一定程度上表征了学习器在查准率和查全率取得相对“双高”的比例。但这个值不容易估算。
收藏