Please enable JavaScript to view this site.

Prism 目前提供三种不同的多元线性回归模型框架:线性、泊松和逻辑回归。本节将介绍线性回归和泊松回归的选项。有关如何进行多元逻辑回归的更多信息,请查看本指南的相关章节

多元线性回归用于 Y 为连续变量的情况。Prism 将数据点与曲线之间垂直距离的平方和最小化。这种方法通常称为最小二乘法。如果假设残差(各点与预测值的距离)的分布是高斯分布,那么这种方法就是合适的选择。

当每个 Y 值都是对象或事件的计数(0、1、2......)时,就可以使用泊松回归。这些必须是实际的计数,不能以任何方式归一化。如果一台机器显示您的样本每分钟有 98.5 次放射性衰减,但您要求计数器对每个样本计数 10 分钟,那么它计数到的放射性衰减为 985 次。这就是您应该输入的泊松回归数值。如果 Y 值是归一化计数,而不是实际计数,则不应选择泊松回归。

选择因变量

有一个变量是因变量,即 Y 变量,您必须告诉 Prism 它是哪个变量。多元回归的目标是找到最能预测该变量的模型。

请注意,Y 变量必须是连续变量。如果结果 (Y) 变量是二元变量(只有两个可能值),则应使用逻辑回归而不是多元回归。

定义模型

Prism 要求您准确指定要拟合的模型。它不能自动为您选择一组变异性或交互作用。请阅读原因。不过,Prism 可以比较两个模型

截距

截距是当所有连续预测因子变量等于零且分类预测因子变量设置为参考水平时结果变量的值。您几乎总是希望包含截距,因此 Prism 会拟合它的值。只有在有充分理由的情况下,才会从模型中移除截距,因为这很少有意义。从模型中移除截距就等于将其设置为零。

主效应

每个主效应将一个参数乘以一个回归系数(参数)。您几乎总是希望在模型中包含所有的主效应。对于每个连续预测变量,只需要一个系数。对于分类预测因子变量,所需的系数数等于比分类变量的级数少一个(由于变量编码过程)。如果取消选中其中一个主效应,那么该预测因子变量基本上就不会参与分析(除非该变 量是交互作用或变异性的一部分,如下所述)。

双向交互作用

每个双向交互作用都会将两个参数相乘,并将乘积乘以一个回归系数(参数)。双向交互作用常用于多元回归,但并非总是如此。为什么是 "交互作用"?因为该模型使用的是两个变异性变量的乘积。当然,两个变量的交互作用有很多种方式,而不仅仅是两个变量相乘的方式。

三向交互作用

每个三向交互作用都是将三个参数相乘,并将该乘积乘以一个回归系数(参数)。与双向交互作用相比,三向交互作用较少使用。

变换

Prism 可以让你在模型中使用任何连续预测因子变量的平方、立方或平方根。如果您希望 Prism 在定义多元回归模型时提供其他变换,请告诉我们。

本示例模型

在本示例中,变量 A 是血压(单位:毫米汞柱),变量 B 是年龄(单位:岁),变量 C 是体重(单位:千克),变量 D 是性别(有 "男性 "和 "女性 "两个级别)。如果选择变量 A 作为依赖度(结果)变量,并在模型中包含变量 B、C 和 D,则所选模型可表示为

血压 ~ 截距 + 年龄 + 体重 + 性别

在这种情况下,拟合数据的完整数学模型为

血压 = β0 + β1* 年龄 + β2* 体重 + β3* 性别[男]

Prism 找到的系数值(β 值)能使数据中结果变量值与方程预测值之间的差平方和最小化。

该模型非常简单,令人惊讶的是它竟然如此有用。以血压为例,该模型假设:

平均而言,年龄每增加一岁,血压就会增加(或降低)一定量(年龄的贝塔系数的拟合优度值)。这个数值对于所有年龄段和所有体重的男性和女性都是相同的。

平均而言,血压每增加(或减少)一磅就会增加(或减少)一定量(体重的贝塔系数的拟合优度值)。所有年龄段和所有体重的男性和女性的这一数值相同。

与女性相比,男性的血压平均会升高(或降低)一定量("性别[男性]"的贝塔系数的拟合优度值;在本例中,"女性 "是预测变量 "性别 "的参考水平)。这个数值对所有年龄和体重的人都是一样的。

这个模型的截距较难概念化,因为它代表年龄和体重都等于零的女性(性别变量的参考水平)。显然,这个值并不代表现实中可能存在的观察值(年龄和体重都不可能等于零),但它对模型来说是一个重要的值,可以通过插入法来预测更合理的值(如女性在年龄和体重平均值下的血压)。

数学术语是指模型是线性的,不允许交互作用。线性是指在其他变量不变的情况下,血压与年龄(或体重)的关系图是一条直线。无交互作用是指所有体重和男女的血压与年龄关系线的斜率相同。

如果您选中了包含年龄与性别交互作用的选项,模型将显示为

血压 ~ 截距 + 年龄 + 体重 + 性别 + 年龄:性别

包含交互作用项的完整数学模型为

血压 = β0 + β1* 年龄 + β2* 体重 + β3* 性别[男] + β4* 年龄*性别[男]

 

 

 

 

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.