多元逻辑回归是多元线性回归的延伸。可使用逻辑回归对因变量进行建模,该因变量具有二进制响应,例如是/否或存在/缺少。逻辑回归的目的是在给定一组X值的情况下,对观察到0或1的概率进行预测或推断。在下文,我们将Y=1的概率写为P(Y=1)。
逻辑回归将线性回归模型拟合至对数优势。该优势在数学上被定义为P(Y=1)/P(Y=0)。人们通常看到优势用于指赔率。例如,3比1的优势是P(Y=1)为0.75的另一种说法。随后,对数优势刚好是优势的自然log(Ln)。
为什么不拟合多元线性回归(MLR)代替多元逻辑回归?存在两个主要原因:
1.MLR的标准统计检验(拟合优度、参数估计、标准误差等)假设残差的高斯分布。违背了这一假设。
2.对于可解读性,最好是谈论观察到“成功”或“失败”的概率。这可用逻辑回归完成,但无法用线性回归完成。
这本质上是一个数学上的技术,其使我们能够使用为MLR模型开发的大量框架。尽管将概率限制在0和1之间,但优势可以是任何正数,随后,对数优势的范围为任何实数。因此,我们可使用我们模型方程的一种常见形式:对数优势(Y)=β0+β1*X1+β2*X2+...随后,我们可根据需要反向转换估计值,以提供关于优势的推断或概率预测。