Please enable JavaScript to view this site.

Navigation: PRISM10统计学 > 三因素方差分析 > 如何做:三因素方差分析

三因素方差分析可能无法回答您的科学问题

Scroll 前一页 Top 后一页 More

在某些情况下,GraphPad Prism可计算三因素方差分析。但在使用三因素方差分析之前,请注意,其通常没有大多数科学家希望的那么有帮助。使用三因素方差分析分析数据时,结果通常不能回答实验设计提出的问题。举例说明:

科学目的与实验设计

已鉴定出在病理条件下血管生成(新血管生长)所需的基因。问题是气在大脑中是否也具有活性。众所周知,缺氧(低氧水平)会刺激大脑中的血管生成。因此,问题是,与正常(野生型,WT)动物相比,在去除基因(敲除;KO)的动物体内血管生成(缺氧刺激)是否会减少。换言之,我们的目的是找出KO缺氧小鼠与WT缺氧小鼠的血管生长是否存在显著差异。

实验设计:

一半动物是野生型。一半动物的感兴趣基因被敲除。

一半动物生活在正常的空气中。一半动物保持在缺氧(低氧)条件下。

在两个时间点(1周和3周)测量大脑区域中的血管数量。

三因素方差分析会回答什么问题?

试验有三项因素:基因型(野生型与KO)、氧气(正常空气与低氧)和时间(1和3周)。因此,似乎可合理认为三因素方差分析是合适的分析。三因素方差分析将报告七个P值(甚至在要求多重比较检验或对比之前)。这些P值检验七个零假设:

基因型的影响。零假设是在两种情况下(缺氧与否)和所有时间点,野生型动物的平均结果等于KO动物的平均影响。这并非很有帮助。您不会期望KO在正常的空气条件下有所不同,因此使用缺氧条件将结果平均化只会混淆试验结果。该P值没有意义。

缺氧影响。零假设是,对于两个基因型和所有时间点,正常空气组的平均结果与缺氧组的平均结果相同。我们已知道缺氧会刺激WT动物的血管生成。该试验旨在探究缺氧是否对KO动物具有不同的影响。将WT和KO动物的结果结合在一起没有意义,因此该P值没有意义。

时间影响。零假设是,对于两种基因型和两种条件(缺氧与否),两个时间点的平均结果相同。但我们已知道血管生成的发生需要时间,因此在接受缺氧处理的正常动物中,后期的血管生长比早期要多。将两种基因型和两种条件结合起来没有实际意义。该P值没有意义。

基因型与缺氧的相互作用。零假设是,在野生型和KO动物中,缺氧的影响在两个时间点相同。这是才是该研究的重点,且在七个P值中,只有一个P值可回答试验问题。但即使是该P值也不能完全检验您所关注的零假设。您真正想知道的是这两种基因型在缺氧条件下是否产生不同结果。纳入在正常空气条件下收集的数据会混淆结果,而非澄清结果。纳入在血管生成可能开始之前最早时间点的数据也会使结果变得模糊。

基因型和时间的相互作用。在两种情况下(缺氧和非缺氧),零假设是两种基因型之间的差异随着时间的推移保持一致。由于试验的整个目的是研究缺氧的影响,将缺氧动物的结果与呼吸正常空气的动物的结果平均化,没有意义。该P值没有用。

缺氧与时间的相互作用。取两种基因型结果的平均值,零假设是缺氧的影响在任何时候均相同。取两种基因型结果的平均值是没有意义的做法,因此该P值没有意义。

基因型、缺氧和时间的三因素交互作用。该P值没有意义,因为很难弄清楚它检验的零假设是什么!

一种替代方法是:双因素方差分析

为什么试验中包括暴露在普通空气中的动物?作为对照。我们并不期望无压力的动物在三周内出现过多的血管生成。另一半动物暴露在低氧环境中,认为它会刺激血管生成。暴露在正常空气中的动物是一个对照,以显示试验按预期进行。因此我认为检查这些结果以确定试验是否有效以及低氧数据是否值得分析是合理方法。如果暴露在普通空气中的动物体内出现大量的血管生成,则就会怀疑是否存在其他毒素。一旦确定试验成功,则在最终分析中可忽略这些数据。

通过分析仅来自缺氧动物的数据,我们归结为两项因素:基因型和时间,因此可通过双因素方差分析分析数据。双因素方差分析报告三个零假设的三个P值:

基因型的影响。零假设是所有时间点的汇总,野生型动物的平均结果等于KO动物的平均影响。这涉及到试验问题,因此可能有帮助。

时间的影响。零假设是,将两种基因型的结果汇总,三个时间点的平均结果相同。但我们已知道,在正常动物中,晚些时候的血管生长比早些时候要多。我们知道晚期比早期出现更多的血管,因此该P值可能很小,且这无助于回答试验问题。

基因型和时间的相互作用。零假设是两种基因型之间的差异在所有时间点均一致。如果P值很大,则不能拒绝该假设。在此情况下,基因型的P值回答实验设计提出的问题。如果P值很小,则将拒绝零假设,并得出结论,基因型之间的差异在不同时间点有差异。在此情况下,多重比较检验可在每个时间点分别比较两种基因型。

最后一行:根据这些数据,将试验的一半视为对照,证明这些方法有效,极大简化数据分析。

统计学家可能反对一些人控制数据提供的关于变异性的信息,因此完全忽略那些数据是不公平的做法。擅长R或SAS(等)的人可找到一种方法,分析所有数据,报告检验感兴趣的特定假设的P值。但这并不简单,也超出大多数科学家的技能。盲目地将数据插入三因素方差分析不会得到可回答试验问题的结果。

更好的选择?线性回归?

方差分析(甚至是双因素)的一个问题是它对待三个时间点就像对待三个物种或使用三种替代药物治疗一样。

另一种分析方法是使用回归。最简单的模型是线性回归(只有两个时间点,无需拟合更复杂的模型)。使用线性回归,观察缺氧动物的血管生成率。将一个斜率与WT动物拟合,将一个斜率与KO动物拟合,并比较斜率。

该方法对我而言似乎是最好的方法。每个斜率本身均为可理解的数据,作为血管生成速率的一个度量。零假设也易于理解(两个速率相同)。这一分析似乎更接近生物学问题,其结果对于非统计学家而言更容易解读。当然,它假设在研究期间的过程中血管生成呈线性,这可能是也可能不是一个合理的假设。

总结

不能仅仅因为实验设计包括三个因素,就认为三因素方差分析是最好的分析。

许多试验被设计为阳性或阴性对照。这些很重要,因为其让您知道一切是否正常。如果对照给出意想不到的结果,其余的数据就不值得分析。一旦您验证对照按预期工作,通常可从关键分析使用的数据中删除这些对照数据。这可极大简化数据分析。

如果一项因素是剂量或时间,拟合回归模型通常比方差分析更能回答试验问题。

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.