Please enable JavaScript to view this site.

要检查多元逻辑回归是否适合这些数据的分析,请自问以下问题。

结果(Y)变量是二元变量(二分变量)吗?

自变量(Y)只能取两个值,在 Prism 中,这两个值必须编码为 0 和 1。

Y 的各行是独立观察结果吗?

逻辑回归的基本假设之一是每一行数据都是唯一的独立观察结果。独立观察结果的本示例是对随机抽取的 100 人进行研究,其中 1 表示阳性结果,0 表示阴性结果,每个人都记录在一行上。如果每个人都被测量了不止一次(比如在研究的不同时间点),那么这些观察结果就不是独立的,逻辑回归也就不合适了。如果研究对象是 50 对已婚夫妇,那么将数据视为 100 个独立观察结果是不公平的。

模型是否能很好地拟合和预测数据?

所有的模型都是错误的,但有些模型是有用的......

Prism 提供了多种指标来评估指定模型与输入数据的拟合程度。但是,您应该记住,将模型拟合到数据以及对模型拟合的解读在某种程度上是受试者的主观臆断。评估给定模型时需要考虑的一些可能性包括

逻辑模型是否能很好地对数据进行分类?换句话说,给定一个合适的临界值(如 0.5),该模型是否能正确预测观察值 0 和 1?您可以在 Prism 中使用预测值与观察值对比图、分类表、Tjur's R 平方、ROC 图和行分类表来评估。

逻辑模型是否优于仅截距模型?您可以使用似然比假设检验来检验。您可能还想进行 Hosmer-Lemeshow 检验。

X 变量是线性依赖度的吗?

如果 X 变量具有较高的多重共线性,那么估计的 P 值和标准误差将毫无意义。请阅读有关多重共线性的更多信息。

您是否有足够的数据来相信您的结果?

与所有统计建模一样,数据越多越好。在分析结果的表格结果页底部,Prism 会报告模型中有多少观察值(分析行数)、模型中有多少参数以及这两个值的比率(#观察值/#参数)。一个经验法则是,每个自变量(X)至少要有十行 0 和十行 1。

是否过度拟合?

变量的变异性是否真的有助于成功几率对数的变化?如果不是,您还想在模型中包含这些协变量吗?有时,根据您对实验和相关科学知识的了解,在模型中保留变量对其解释或实验设计方式很重要。但是,如果某个变量并非必要,也许只要说它在其他 X 个预测因子存在的情况下无助于预测结果,并将其删除就足够了。但去除变异性是有争议的,所以不要不假思索就这么做。

你是否拟合不足?

如果你的预测性能不尽如人意,那么也许你缺少了一些关键变量,而这些变量要么是你没有测量到的,要么是没有包含在模型中的。如果关键变异性是你没有测量到的,那么你能做的不多,只能回去收集更多的数据。不过,如果你在模型中遗漏了一些变异性变量,那么你可能想研究一下当这些变量被纳入模型时,它们会对模型性能产生怎样的影响。您还可以探索对 X 变量进行交互作用和变异性拟合的模型。

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.