回归模型通过一个或多个其他变量 X 预测一个变量 Y。Y 变量称为依赖度变量、响应变量或结果变量。X 变量称为自变量、解释变量或预测因子变量。
每个 X 变量可以是实验者操纵的一个值、实验者选择或分配的一种处理方法,也可以是实验者测量的一个值。
每个自变量可以是:连续性变量(如年龄、血压、体重)或分类变量(如性别变量中的男性和女性,或细胞系变量中的 HeLa、HEK 298、CHO 和 Jurkat)。当使用变异性变量时,必须使用多种方法之一对其进行 "编码"(下文将详细介绍)。请注意,Prism 会自动对回归模型中的变异性变量进行编码,因此无需自己进行编码。
多元回归模型将因变量定义为自变量和一组参数(也称为回归系数)的函数。回归方法可以找到每个参数的值,使模型预测尽可能接近数据。这种方法类似于线性回归,即确定斜率和截距(模型的两个参数或回归系数)的值,使模型尽可能地从 X 预测 Y。
简单回归指的是只有一个 X 变异性的模型。多元回归也叫多变量回归,指的是有两个或两个以上 X变异性的模型。
虽然这些方法超出了本指南的范围,但确实存在可以同时分析多个结果(Y 变异性)的方法。这些方法称为多元方法,包括因子分析、聚类分析、主成分分析和多重方差分析(MANOVA)。这些方法与单变量方法截然不同,后者只处理单个 Y 变量。
请注意,多变量和单变量这两个术语的用法并不一致。有时多变量是指有一个结果和多个自变量的多变量方法(即多元回归和逻辑回归)。而有时单变量是指只有一个自变量的简单回归。
Prism 只执行线性多元线性回归。这意味着每个参数都与 Y 成线性关系。如果绘制 Y 随参数变化而变化的曲线图(同时保持所有 X 值和所有其他参数不变),曲线图将是一条直线。
当然,也可以通过非线性函数来编写一个 Y 变异性和多个与 Y 相关的 X 值的模型。但 Prism 目前还不能执行多重非线性回归。如果这对您有帮助,请告诉我们详情。
变异性是指那些具有有限数量的可能值(称为 "等级")的变量。本示例中,"汽车制造商 "可以是一个分类变量,其级别为 "福特"、"丰田"、"道奇"、"现代 "等。然而,回归模型依赖于变量具有数字来执行必要的计算。因此,为了将分类变量纳入回归模型,必须将其转换为仅由数字组成的变量(更准确地说,是一组变量)。