ROC曲线的全部意义在于帮助您决定如何在“正常”与“异常”之间划定界限线。如果所有控制值均高于(或低于)所有患者值,则这将是一个简单决定。然而,通常这两种分布重叠,使得做决定并不那么容易。
为帮助您做出该决定,Prism在不同临界值下将检验的灵敏度和特异性制成表格以及绘制成图。
灵敏度: 检验正确识别为阳性的患病患者比例。
特异性: 检验正确识别为阴性的未患病患者比例。
Prism使用数据表中的每个值作为临界值来计算灵敏度和特异性。这意味着它计算了许多对灵敏度和特异性。I
Prism以两种形式显示这些结果。标有“ROC”曲线的表格用于创建100%图表 - 特异性%与灵敏度%。标有“灵敏度和特异性”的表格将这些值以及正常和异常之间每个可能临界值的95%置信区间制成表格。
ROC曲线下面积称为 C statistic, . 一致 统计 或者 C指数。 其 可以量化检验区分患病个体与非患病个体的整体能力。一项真正无用的检验(一项识别真正阳性的能力未优于扔硬币法的检验)的面积是0.5。一项完美的检验(一项无假阳性和假阴性的检验)的面积是1.00。您的检验的面积值将介于这两个值之间。即使您选择将结果绘制为百分比图,Prism也会将面积报告为分数。
Prism会计算整个AUC曲线下面积,从(0,0)开始,到(100,100)结束。请注意,无论您是否要求Prism绘制ROC曲线到这些极限,其均会计算整条曲线的面积。
虽然很明显,曲线下面积与检验正确识别正常与异常的整体能力有关,但如何解释该面积本身并不明显。然而,存在一种非常直观的解释。
如果患者的检验值高于对照的检验值,则:
该面积表示随机选择的患者比随机选择的对照具有更高检验结果的概率。
如果患者的检验结果往往低于对照组的检验结果:
该面积表示随机选择的患者比随机选择的对照具有更低检验结果的概率。
例如:如果面积平均等于0.80,则患者的检验结果将比80%的对照检验结果更加异常。如果检验完美,则每名患者的检验结果均会比每个对照组更不正常,面积等于1.00。
如果检验毫无价值,在识别正常与异常方面的能力未优于随机法,则研究者会预期一半的对照者比已知患病的患者具有更高的检验值,而另一半具有更低的检验值。因此,曲线下面积为0.5。
ROC曲线下面积决不能小于0.50。如果第一次计算的面积小于0.50,则Prism会将异常的定义从较高的检验值反转到较低的检验值。该调整将导致曲线下面积大于0.50。
Berrar指出,必须谨慎解释ROC曲线,解释的内容比观察AUC(1)更多。
此外,Prism还会报告ROC曲线下面积的标准误差,以及95%置信区间。这些结果通过非参数方法计算得到,该方法未对患者和对照组的检验结果分布做出任何假设。
解释置信区间很直接。如果患者组和对照组代表较大群体的随机抽样,则您可以有95%的信心认为置信区间包含真实面积。
Prism通过报告一个P值来完成您的ROC曲线评价,该P值检验了曲线下面积确实等于0.50这一零假设。换言之,P值回答了该问题:
如果检验诊断出的疾病概率与抛硬币法一样,则ROC曲线下面积有多大可能会和您观察到的一样高(或更高)?
如果P值很小(通常如此),您可能会得出结论:检验确实区分了异常患者与正常对照者。
如果P值很大,这意味着您的诊断试验在患者诊断方面的概率与抛硬币法一样。您很可能不会收集足够数据来绘制一条ROC曲线,除非您确定您的试验确实可以诊断疾病,因此应很少出现高P值。
1. | Berrar D和Flach P.,临床微阵列研究中ROC分析的注意事项和缺陷(以及避免方法)。《生物信息简报》,牛津大学出版社;2011年3月21日;13(1):bbr 008 - 97。 |