GraphPad Prism 可以在特定情况下计算三向方差分析。但在使用三向方差分析之前,请注意它的作用往往比大多数科学家希望的要小得多。当使用三向方差分析来分析数据时,结果往往无法回答实验设计的问题。让我们通过一个本示例来说明:
已经发现一种基因在病理条件下对血管生成(新血管的生长)是必需的。问题是它在大脑中是否也活跃。 众所周知,缺氧(低氧水平)会引发脑血管生成。因此,问题在于,与正常(野生型,WT)动物相比,去除了该基因(敲除;KO)的动物的血管生成(受缺氧刺激)是否会减少。换句话说,我们的目标是找出 KO 缺氧小鼠与 WT 缺氧小鼠相比,在血管生长方面是否存在显著差异。
实验设计
•一半动物为野生型。一半动物的相关基因被敲除。
•一半动物在正常空气中饲养。一半动物在缺氧(低氧)条件下饲养。
•在两个时间点(1 周和 3 周)测量大脑某一区域的血管数量。
实验有三个因素:基因型(野生型 vs KO)、氧气(正常空气 vs 低氧)和时间(1 周和 3 周)。因此,认为三向方差分析是合适的分析似乎是合乎逻辑的。三向方差分析会报告七个 P 值(甚至在要求进行多重比较检验或对比之前)。这些 P 值检验了七个零假设:
•基因型的影响。零假设是在两种条件下(缺氧或不缺氧)和所有时间点,野生型动物的平均结果等于 KO 动物的平均影响。这并不是很有用。你不会指望 KO 在正常空气条件下会有什么不同,因此将其与缺氧条件下的平均值相加只会混淆视听。这个 P 值没有帮助。
•缺氧的影响。零假设是,在两种基因型和所有时间点下,正常空气中的平均结果与缺氧中的平均结果相同。我们已经知道缺氧会引起 WT 动物的血管生成。本实验的目的是观察缺氧是否会对 KO 动物产生不同的影响。将 WT 动物和 KO 动物的结果结合在一起并没有实际意义,因此这个 P 值没有任何帮助。
•时间的影响。零假设是,对于两种基因型和两种条件(缺氧与否),两个时间点的平均结果相同。但我们已经知道,血管生成需要时间,因此在接受缺氧治疗的正常动物中,晚期的血管生长会多于早期的血管生长。将两种基因型和两种条件结合起来并没有实际意义。这个 P 值没有帮助。
•基因型与缺氧的交互作用。零假设是,缺氧对野生型和 KO 动物的影响在所有两点上都是相同的。这算是研究的重点,也是七个 P 值中唯一一个似乎能回答实验问题的 P 值。但即使是这个 P 值,也不能完全检验你所关心的零假设。 你真正想知道的是,两种基因型在缺氧情况下是否有不同的结果。把在正常空气下收集的数据包括进来会混淆结果,而不是澄清结果。在血管生成有机会开始之前,将最早时间点的数据包括在内,也会混淆视听。
•基因型与时间的交互作用。在两种条件下(缺氧和不缺氧),零假设是两种基因型之间的差异随着时间的推移是一致的。由于实验的全部目的是研究缺氧的影响,因此将缺氧动物的结果与呼吸正常空气的动物的结果平均起来没有任何意义。这个 P 值没有任何用处。
•缺氧与时间的交互作用。将两种基因型平均起来,零假设是缺氧的影响在所有时间都是一样的。将两种基因型平均起来确实没有意义,因此这个 P 值没有用。
•基因型、缺氧和时间的三方交互作用。 这个 P 值没有用,因为要弄清楚它检验的是什么零假设太难了!
为什么实验中包括暴露在普通空气中的动物?作为对照。我们预计未受压力的动物在三周内不会有太多血管生成。另一半动物暴露在缺氧环境中,众所周知,缺氧会诱发血管生成。暴露在普通空气中的动物是对照组,以显示实验达到了预期效果。因此,我认为可以通过这些结果来判断实验是否成功,以及缺氧数据是否值得分析。如果暴露在普通空气中的动物有很多血管生成,你就会怀疑存在其他毒素。 一旦确定实验有效,在最终分析中就可以忽略这些数据。
只分析缺氧动物的数据,我们就只剩下两个因素:基因型和时间,因此可以用双向方差分析来分析数据。双向方差分析报告了三个零假设的三个 P 值:
•基因型的影响。零假设是汇集所有时间点,野生型动物的平均结果等于 KO 动物的平均影响。 这涉及到实验问题,因此是有用的。
•时间的影响。零假设是,集合两种基因型,三个时间点的平均结果相同。但我们已经知道,正常动物在晚期比早期有更多的血管生长。我们知道晚期的血管比早期的多,所以这个 P 值可能很小,这无助于回答实验问题。
•基因型与时间的交互作用。 零假设是两种基因型的差异在所有时间点都一致。如果 P 值很大,就不会拒绝该假设。在这种情况下,基因型的 P 值回答了实验设计的问题。如果 P 值很小,您将拒绝零假设,并得出结论:基因型之间的差异在不同时间是不同的。在这种情况下,多重比较检验可以单独比较每个时间点的两种基因型。
一句话有了这些数据,把一半的实验看作是证明方法有效的控制数据,就大大简化了数据分析。
统计学家可能会提出异议,认为这些控制数据提供了变异性信息,因此完全忽略这些数据并不公平。熟练掌握 R 或 SAS(等)的人可以找到分析所有数据的方法,报告检验特定相关假设的 P 值。但这远非简单易行,也超出了大多数科学家的技能范围。盲目地将数据插入三向方差分析,并不能得出回答实验问题的结果。
单向方差分析(即使是双向方差分析)的一个问题是,它对三个时间点的处理完全等同于对三个物种或三种备选药物的处理。
替代分析方法是使用回归法。最简单的模型是线性模型(而且只有两个时间点,拟合更复杂的模型也没有意义)。使用线性回归分析缺氧动物的血管生成率。对 WT 动物和 KO 动物分别拟合一个斜率,然后比较斜率。
在我看来,这种方法是最好的。作为血管生成率的衡量标准,每个斜率本身都是可以理解的。零假设也可以理解(两个速率相同)。分析似乎更接近生物学问题,非统计学家也更容易解释结果。当然,它假设血管生成在研究的时间过程中是线性的,这可能是一个合理的假设,也可能不是。
•不要因为实验设计包含三个因素,就认为三向方差分析是最好的分析方法。
•许多实验都设计了阳性或阴性对照。这些对照非常重要,因为它们可以让您知道一切是否都按计划进行。如果控制数据给出了意想不到的结果,那么就不值得分析其余的数据了。一旦验证了控制数据符合预期,通常就可以将这些控制数据从用于关键分析的数据中删除。这可以大大简化数据分析。
•当因素是剂量或时间时,拟合回归模型往往比方差分析更能回答实验问题。