要检查简单逻辑回归是否适合您的这些数据,请自问以下问题:
自变量(Y)只能取两个值,在 Prism 中,这两个值必须分别编码为 0 和 1。
逻辑回归的基本假设之一是每一行数据都是唯一的独立观察结果。独立观察结果的本示例是对随机抽取的 100 人进行研究,其中 1 表示阳性结果,0 表示阴性结果,每个人都记录在一行上。如果每个人都被测量了不止一次(比如在研究的不同时间点),那么这些观察结果就不是独立的,逻辑回归也就不合适了。如果一些参与者属于同一个家庭,那么独立性也会受到质疑,因为来自一个家庭的两个人之间的几乎所有结果都可能比来自两个不相关的人之间的结果更相似。
所有的模型都是错误的,但有些模型是有用的...
Prism 提供了多种指标来评估简单逻辑模型与输入数据的拟合程度。但是,您应该记住,将模型拟合到数据以及对模型拟合的解读--在某种程度上--是受试者的主观臆断。评估给定模型时需要考虑的一些可能性包括
•模型是否能很好地对数据进行分类?换句话说,模型是否能正确预测观察到的 0 和 1?您可以在 Prism 中用多种不同的方法来评估,如使用 Tjur 的 R 平方、ROC 曲线图(ROC 曲线下面积)和行分类表。
•逻辑模型是否优于仅截距模型?Prism 用两种相关但略有不同的方法来检验这一概念:使用 Wald 检验来考察 β1 是否显著不为零;使用似然比检验来直接比较给定模型和仅截距模型。
与所有统计建模一样,数据(通常)越多越好。在分析结果表格的底部,Prism 会报告模型中包含了多少观测值(分析行数)。对于简单逻辑回归,一般的经验法则是至少要有十个结果为 0 的观测值和十个结果为 1 的观测值。
在简单逻辑回归的情况下,有可能您的预测因子(X)变量只是影响结果是否成功的多个变量之一。如果模型的预测性能不尽如人意,也许你缺少了某些关键变量,而这些变量要么是你没有测量,要么是你选择不建模。如果您只是选择不对它们建模,那么您肯定应该使用多重逻辑回归来研究它们的影响--多重逻辑回归是简单逻辑回归的自然延伸。点击此处了解更多有关多元逻辑回归的信息。另一方面,如果关键变异性是您没有测量的变量,那您就没戏了。回去重复实验,重点收集更多信息。然后再回来进行多元逻辑回归!