当因变量(Y)是二分的(是/否、成功/失败等)时,使用多元逻辑回归。因变量(Y)仅可有两个值。因变量可以是值为“0”和“1”的连续变量,也可以是有两个(文本)级别的分类变量。给定一个或多个X变量的特定值,多元逻辑回归将提供Y等于1的概率(或Y等于分配分类级别的概率)的拟合。
从下拉菜单中选择包含您的因变量(Y)的适当列。请注意,该变量仅可包含两个值(其必须是值为“1”和“0”的连续变量或有两个级别的分类变量)。如果连续变量(值为“0”和“1”)用作因变量,则可添加标号,在“参数”对话框的“选项”选项卡上标识这些值。
除对Y值的限制外,数据的输入方式与多元线性回归的方式相同。Prism可简单地选择将哪些变量纳入模型中,包括两因素和三因素交互作用和变换。然而,Prism无法自动为您选择一组变量或交互作用。阅读为什么。
对于逻辑回归,截距是所有X值为零时的预期对数优势。如果其并未给您带来直观价值,并不是只有您一个人遇到该问题。由于逻辑回归中使用的因变量的对数优势变换,因此该值比线性回归的值更难以解读。也许理解该值最简单的方法是,根据可通过简单逻辑回归绘制的S逻辑曲线进行思考。当X为零时,截距项可提供有关该S曲线上的值的信息。使用一些单代数,可证明在X=0时,该S曲线上的值由下式给出:
X等于0时的概率=eβ0/(1+eβ0)
另一种思考方式是,截距项允许您在缺少(或考虑)您的预测变量的情况下确定成功的概率。
关于逻辑回归模型的截距,需要记住的一件非常重要的事情是,几乎没有理由排除该截距。如上所述,逻辑回归模型的截距(β0)值告诉您,当所有预测变量(X变量)均等于零时,有关预测对数优势的结果。如果我们将这一信息从对数优势标度变换为概率标度,模型的截距可提供在考虑所有其他变量后观察到“成功”(Y=1)的概率信息。然而,通过从模型中排除截距,您假定当所有的X变量均为零时,观察到“成功”的概率等于0.5(或50%)。如果您感兴趣的话,您可以在此处阅读有关数学的更多内容。但底线是,在无预测因子的情况下,您能够假设(或您想要假设)“成功”的概率为0.5的情况是非常罕见。因此,您几乎始终希望将截距项纳入您的模型中。
使用复选框选择希望纳入模型中的X变量。拟合模型时,Prism将为每个选定的主效应(以及每个选定的交互作用和变换)确定一个回归系数。默认情况下,将选择所有主效应。如果您取消选中其中一个主效应,则该X变量基本上不会成为分析的一部分(除非该变量是交互作用或变换的一部分,如下所述)。
Prism可简单地在模型中纳入自变量的两因素和三因素交互作用。两因素交互作用将两个变量相乘以创建一个新变量,而模型将为该变量确定一个回归系数。类似地,三因素交互作用将三个变量相乘。三因素交互作用比两因素交互作用更不常用。
Prism允许您使用模型中任何变量的平方、立方或平方根。定义多元回归模型时,如果您希望Prism提供其他变换,请告知我们。