如需检查多元逻辑回归是否属于适于您这些数据的适当分析,请自问以下几个问题。
独立(Y)变量只能取两个值,在Prism中,必须将这些值编码为0和1。
逻辑回归的基本假设之一是每行数据均为唯一的独立观察结果。关于独立观察结果,在此举例说明,在一项涉及100名随机选择的参与者的研究中, 1表示正值结果,0表示负值结果,每名参与者的数据记录在单独的一行中。如果对每名参与者测量一次以上(例如,在研究的不同时间点进行多次测量),则观察结果不独立,逻辑回归不合适。如果本研究的对象是50对已婚夫妇,将这些数据视为100个独立观察结果不公平。
所有模型均错误,但有些有用……
Prism提供了多项指标用于评价指定模型与输入数据之间的拟合程度。但是,您应记住,模型与数据的拟合以及对模型拟合的解读存在一定程度的主观性。评价给定模型时,需考虑的一些可能性包括:
•逻辑模型能否良好地分类数据?换言之,给定一个合适的临界值(例如0.5),模型是否能正确预测观察到的0和1?您可以使用预测图表与观察图表、分类表、Tjur R平方、ROC图和行分类表,在Prism中对此进行评价。
•逻辑模型是否优于仅截距模型?您可以使用似然比假设检验对此进行检验。您可能还想要运行Hosmer-Lemeshow检验。
如果X变量具有高多重共线性,则估计的P值和标准误差将没有意义。请阅读更多有关多重共线性的信息。
与所有其他统计建模一样,数据越多越好。在分析结果的列表结果表底部,Prism将报告模型中的观察结果(已分析的行数)数量、模型中包含的参数数量以及这两个值的比率(#个观察结果/#项参数)。经验法则是各独立(X)变量至少有十行0和十行1。
变量变化是否真的会导致成功log(优势比)的变化?如果不是,您是否还想要在该模型中纳入那些协变量?有时,为便于其解读或由于根据您对实验和所涉科学的了解设计实验的方法,务必在模型中保留变量。但如果变量并非必要变量,则在存在其他X预测因子的情况下,足以说该变量不会有助于预测结果,并将其删除。但删除变量存在争议,因此请勿立即进行删除。
如果您的预测性能不如预期,则您可能遗漏了一些您未测量或未纳入该模型的关键变量。如果关键变量是未测量的变量,则除了返回收集更多的数据,没有更好的选择。但如果将一些变量排除在该模型外,则您可能想要检验在纳入时这些变量是如何影响模型性能。您还可探索使用X变量的相互作用和转换来拟合模型。