通常情况下,逻辑回归的目标只是将观察结果归类为模型所描述的两种可能结果之一。我们已经讨论过如何根据一组自变量 (X) 值计算出 "成功"(Y=1)的概率。使用预测概率并应用以下规则进行分类:
1.定义一个临界值(介于 0 和 1 之间)
2.确定观察值的成功概率,并将其与临界值进行比较
3.如果确定的概率大于临界值,则将观察值归类为成功。如果确定的概率小于临界值,则将观察值归类为失败
Prism 提供两种方法,根据逻辑模型对数据的分类报告结果。这两种方法包括 ROC 曲线下面积 (AUC) 和 2x2 分类表,具体如下。
ROC 曲线下面积 (AUC) 提供了一个综合值,表示模型在所有可能的截断值下对 0 和 1 的正确分类程度。AUC 值介于 0.5 和 1 之间,其中面积为 0.5 意味着该模型预测结果为 1 或 0 的效果不比掷硬币好,而面积为 1 则意味着该模型的预测效果非常完美。为了更详细地了解所报告的 AUC 值,请看逻辑回归 ROC 曲线各种极端值的一些本示例。
分类表报告的是一个 2x2 表,显示在用户指定的临界值下正确分类值的数量。该表有四个条目,报告了正确(和错误)预测的观察值 0(和 1)的数量。此外,分类表还将提供观察到的 1 和 0 的总数、预测到的 1 和 0 的总数、正确分类的 1 和 0 的百分比、正确分类的观察值总数的百分比以及正负检验力等信息。
•观察到的(输入的)0 总数 = A + B
•观察到(输入)的 1 总数 = C + D
•预测的 0 总数 = A + C
•预测的 1 总数 = B + D
•观察到的 0 的正确分类百分比 = (A/(A+B))*100
•正确分类的观测值 1 的百分比 = (D/(C+D))*100
•所有观测值中被正确分类的百分比 = ((A+D)/(A+B+C+D))*100
•负检验力 (%) = (A/(A+C))*100
•正检验力 (%) = (D/(B+D))*100
|
预测值 0 |
预测 1 |
观测值 0 |
A |
B |
观测值 1 |
C |
D |
从分类表中还可以获得许多 Prism 没有直接报告的其他值。例如,从此类数据中获得的常见值包括错误发现率(B/(B+D))、错误否定率(C/(C+D))等。如需了解更多信息,请阅读有关从分类表中可以计算出的值的更多内容。
还请注意,灵敏度和特异性这两个常用值也可以从分类表中计算出来。对于选定的临界值(默认值为 0.5),灵敏度和特异性可根据分类表中的值计算如下:
灵敏度 = D/(C+D)
特异性 = A/(A+B)
Prism 会在 "正确分类百分比 "一栏中报告这些数据。观察到的正确分类为 1 的百分比 "是灵敏度,"观察到的正确分类为 0 的百分比 "是特异性。Prism 以百分比的形式报告。