Please enable JavaScript to view this site.

类似于简单线性回归,简单逻辑回归试图找到一组参数的最佳拟合值。然而,不同于简单线性回归的是,简单逻辑回归通过迭代过程找到最佳拟合值。迭代过程从这些参数的某些初始值开始,逐步朝着最佳拟合值前进。因此,对于某些数据集,该迭代算法无法计算出这些最佳拟合值。出现这种情况时,Prism会提供一条错误消息,指出数据中可能存在“完美分离”问题,或仅有一个X值。

对于简单和多元逻辑回归,确定最佳拟合值的过程中涉及的数学概念(以及在此过程中可能出现的误差)相同。下文给出了简单逻辑回归中为何会出现这条错误信息的非常基本的解释。有关模型拟合过程和可能出现的错误的更详细解释,见多元逻辑回归的相应页面

完美分离

X变量值是Y变量值的完美预测因子时,“分离”是一种应用于数据集的概念。换言之,对于数据集中的每个观察结果,X小于某个值时,Y将获得一个结果,而X大于该值时,Y将获得相反结果,以下数据是完美分离的示例:

在上述数据集中,X小于或等于5时,所有Y值均为0,而X大于5时,所有Y值均为1。无法拟合S形逻辑曲线,因为数据未给出线索,即,X等于5.1或5.5或介于5-6之间的任何值时预期的结果。

数据未“完美”分离时,会出现非常密切相关的问题,例如在该数据集中:

在此处,您可观察到,X值小于5时,Y等于0,X值大于5时,Y等于1。但X=5时,我们会同时获得Y=0和Y=1这一观察结果,这是分离的特殊情况,称为“拟完美分离”。

仅有一个X值

简单逻辑回归的目标在考虑到预测因子值(X变量)的情况下,预测“成功”的概率(Y=1)。但如果所有观察结果的预测因子值相同,则无法拟合预测“成功”概率与预测因子之间的函数关系的模型。

在数学上,该问题由介于β0-β1之间的线性相关性导致。当模型拥有多个预测因子变量时,多元逻辑回归中也会出现该问题。

 

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.