通常来说,逻辑回归的目标是仅将观察结果分类为模型描述的两种可能结果之一。我们已讨论了如何根据一组自变量(X)的值来计算“成功”(Y=1)的概率。通过使用预测概率并应用以下一组法则来进行分类工作:
1.定义一个临界值(在0和1之间)
2.确定观察结果成功的概率,并将其与临界值进行比较
3.如果确定的概率大于临界值,则将观察结果分类为成功。如果确定的概率小于临界值,则将观察结果分类为失败
Prism提供了两种基于逻辑模型的数据分类来报告结果的方法。这些包括ROC曲线下面积(AUC)和2x2分类表,如下所述。
ROC曲线下面积(AUC)提供了一个聚合值,该值表示模型如何正确地使用所有可能的临界值对0和1进行分类。AUC值的范围在0.5和1之间,其中面积为0.5意味着模型预测的结果将是1或0,这不比抛硬币更好,且面积为1意味着模型完美预测。如需更详细地了解报告的AUC值,请查看一些关于逻辑回归ROC曲线的各种极端情况示例。
分类表报告一个2x2的表,该表显示了在用户指定临界值点处正确分类的值的数量。该表有四个表项,其报告了正确(和不正确)预测的观察到的0(和1)的数量。此外,该分类表将提供关于观察到的1和0的总数、预测的1和0的总数、正确分类的1和0的百分比、正确分类的观察结果总数的百分比以及阳性和阴性预测能力的信息。
•观察的(输入)0的总数=A+B
•观察的(输入)1的总数=C+D
•预测的0的总数=A+C
•预测的1的总数=B+D
•正确分类的观察到的0的百分比=(A/(A+B))*100
•正确分类的观察到的1的百分比=(D/(C+D))*100
•正确分类的所有观察结果的百分比=((A+D)/(A+B+C+D))*100
•阴性预测能力(%)=(A/(A+C))*100
•阳性预测能力(%)=(D/(B+D))*100
|
预测值0 |
预测值1 |
观察值0 |
. |
B |
观察值1 |
C |
D |
从分类表中还可以获得许多其他值,但Prism不会直接进行报告。例如,从这类数据中获得的常见值包括假发现率(B/(B+D))、假阴性率(C/(C+D))和许多其他值。如需附加信息,阅读更多关于可以从分类表中计算的值的信息。
还请注意,两个常见值-灵敏度和特异性-可从分类表中计算出来。对于所选的临界值(默认为0.5),灵敏度和特异性可从分类表中的值计算得出:
灵敏度=D/(C+D)
特异性=A/(A+B)
Prism在“正确分类百分比”列中报告了这些内容。“正确分类的观察的1的百分比”为灵敏度,“正确分类的观察的0的百分比”为特异性。Prism将这些报告为百分比。