在进行逻辑回归时,选择缺少截距项 (β0)的模型是很不常见的,以至于 Prism 会显示警告,提醒您确保做出该决定是有充分理由的。
如果从模型中排除截距项,就等于假设当所有预测变量都为零时,观察到成功的概率(P(Y=1))等于 0.5。这种假设很少是合理的,因此逻辑回归模型中几乎总是保留截距项。让我们来看看逻辑回归的模型,探讨一下这个问题背后的一些数学原理:
Ln(几率)= β0 + β1*X1 + ...
如果我们将上式中 Xi 的值设为零,它就会简化为
Ln(几率)= β0
因此,截距 β0 等于所有其他预测因子为零时的对数几率。将截距排除在模型之外,在数学上等同于将截距项设为零。如果我们将 eβ0 设为零,并对上式进行指数化运算,就可以得到
eLn(几率)=eβ0
几率 =eβ0
几率 =e0
几率 = 1
如果我们现在利用优势比可以写成 "Y=1 的概率 "与 "1-Y=1 的概率 "之比这一事实,那么
几率 = 1
P(Y=1)/[1 - P(Y=1)] = 1
求解 P(Y=1),我们得到
P(Y=1) = (1)*[1 - P(Y=1)]
P(Y=1) = 1 - P(Y=1)
2*P(Y=1) = 1
P(Y=1) = 0.5
因此,通过从逻辑回归模型中排除截距,您做出了这样的假设:当所有预测因子都为零时,观察到成功的概率为 50%。这一假设很少适用,因此逻辑回归模型中几乎总是包含截距项。