评估一个模型时,询问的一个合理问题可能是,“模型在对数据中观察到的0和1进行分类的表现如何?”
逻辑回归计算接收“正”结果的概率(在数据表中编码为1)。如需使用逻辑回归来预测一个新的观察结果是否为“正”或“负”时,请指定一个临界值,该值指定将被视为“正”的最小概率。标准临界值为0.5,这意味着如果预测概率大于0.5,则该观测结果被分类为“正”(或简单地称为1)。如今我们了解了临界值告诉我们的内容,让我们查看Prism提供的三种分类方法。
ROC曲线下面积(AUC)提供了一个聚合值,该值表示模型如何正确地使用所有可能的临界值对0和1进行分类。AUC值的范围在0.5-和1之间,其中面积为0.5意味着模型预测的结果将是1或0,这不比抛硬币更好,且面积为1意味着模型完美预测。提供一些关于逻辑回归ROC曲线的各种极端情况示例。
分类表报告一个2x2的表,该表显示了在用户指定临界值点处正确分类的值的数量。该表有四个表项,其报告了正确(和不正确)预测的观察到的0(和1)的数量。此外,该分类表将提供关于观察到的1和0的总数、预测的1和0的总数、正确分类的1和0的百分比、正确分类的观察结果总数的百分比以及阳性和阴性预测能力的信息。详情。
行分类生成包含两列的附加表。第一列包含在数据表中找到的所选因变量(Y)列中的值副本。第二列包含由对应于第一列中每个表项(每行)的模型生成的预测概率。