如需检查多元回归是否属于适于您的这些数据的适当分析,请自问以下几个问题。
在许多实验中,X和Y之间的相关性呈非线性,从而使多远回归不适用。在某些情况下,也许可以变换一个或多个X变量来创建线性关系,也可将数据限制在有限的X变量范围内,其关系接近线性。一些程序(但目前没有一个来自GraphPad软件)可用多个自变量执行非线性回归。
多元回归假设残差是随机分布与高斯分布。
多元回归假设模型预测的数据分散对于所有X值具有相同的标准偏差。如果具有较高(或较低)X值的点也倾向于远离最佳拟合线,则将违反该假设。标准偏差在各处均相同的这一假设称为同方差性。Prism提供了不等加权,但假设加权残差平均起来在任何地方均相同。
回归模型假设所有X值完全正确,实验误差或生物可变性只影响Y值。这种情况很少发生,但可充分假设,与y值可变性相比,任何X测量值的精确度均较高。
一个值比回归模型预测的值高或者比其低应该具有随机性,不应对另一个点是在线的上方还是下方造成影响。
与所有统计学一样,回归的目的是分析样本中的数据,并对总体作出有效推断。使用多元回归技术并不总能达到该目标。很容易得出适用于样本数据拟合的结论,但在总体中并不真实。重复研究时,结论将无法重现。该问题叫做 过度拟合.问的问题比数据所能回答的更多时,就会发生这种情况-您在模型中有过多的自变量,而受试者数量却很少。有多少个自变量就会过多?对于多元回归,经验法则是每个自变量(Prism中的列)至少有10-20位受试者(病例;Prism中的行)。因此,用五个自变量拟合一个模型需要约50-100名受试者或病例,这是经验法则,不是严格的标准。
如果病例较变量少则分析几乎没有意义。