Please enable JavaScript to view this site.

单因素方差分析可以比较三组或更多不匹配组,并以群体服从高斯分布该假设为基础。

P值

P值可以检验零假设,即所有组的数据均来自具有相同平均值的群体。因此,P值回答了该问题:

如果所有群体确实具有相同的平均值(治疗无效),则随机抽样会导致如本实验中所观察到的那样远(或更远)的平均值的几率有多大?

如果总体P值很大,则数据不给您任何理由来得出平均值不同的结论。即使群体平均值相等,您也不会惊讶于偶然发现样本平均值如此遥远。这不等于说真正的平均值均相同。您只是缺失令人信服的证据来证明这些平均值不同。

如果总体P值很小,则您所观察到的差异不太可能因随机抽样所致。您可拒绝所有群体均具有相同平均值的想法。这并不意味着每个平均值均不同于其他平均值,只是至少有一个平均值不同于其他平均值。观察后检验的结果,找出差异。

F比率和方差分析表

P值基于根据方差分析表计算的F比率得到。

方差分析将所有值之间的变异性划分为因研究组平均值之间的变异性(因治疗)而产生的分量和另一个因组内变异性(又称“残差变异”)而产生的分量。组内(列内)变异性可量化为每个值与其组平均值之间的差值平方和。这是残差平方和。组间变异性(由于治疗)可量化为组平均值和总平均值(所有组中所有值的平均值)之间差异的平方和。根据每组的大小进行调整后,这将成为治疗平方和。

每个平方和与一定数量的自由度相关联(df,从受试者人数与研究组人数计算),且均方值(MS)通过将平方和除以适当数量的自由度计算得到。这些可以是方差。均方残差的平方根可以是合并的标准偏差。

F比率是两个均方值的比率。如果零假设为真,则在大多数情况下,F比率接近1.0。一个高F比率意味着群体平均值的变异性大于预期程度。如果零假设错误(数据并非从具有相同平均值的群体中抽样得到),且随机抽样在一些组中以较大值结束,而在另一些组中以较小值结束时,您会看到一个较高的F比率值。

P值由F比率和方差分析表中显示的两个自由度值决定。

等方差检验

方差分析以“数据从具有相同标准偏差的群体中抽样得到”该假设为基础。Prism使用两种检验来验证该假设。其计算了Brown - Forsythe检验,以及(如果每个组至少有五个值时)计算Bartlett检验。未提供是否运行这些检验的选项。Prism会自动这样做,并始终报告结果。

这两种检验均计算了旨在回答该问题的P值:

如果群体确实具有相同的标准偏差,您随机选择标准偏差彼此不同(或更不同)的样本的可能性有多大?

Bartlett检验

Prism报告了“纠正”Barlett检验的结果,如Zar(1)第10.6节中所述。如果数据确实从高斯分布抽样得到,则Bartlett检验的效果很好。但是,如果分布稍微偏离高斯分布,即使标准偏差之间的差异很小,Bartett检验也可能报告一个小P值。出于该原因,许多人不推荐该检验。这就是我们增加Brown和Forsythe检验的原因。它和Bartlett检验的目标相同,但对正态性的轻微偏离不太敏感。我们建议您注意Brown - Forsythe结果,忽略Bartlett检验(我们在此保留该检验的目的是与Prism的先前版本保持一致)。

Brown - Forsythe检验

Brown - Forsythe检验的概念很简单。数据表中的每个值均通过减去该列的中值进行变换,然后取差值的绝对值。对这些值进行单因素方差分析,方差分析的P值作为Brown - Forsythe检验的结果报告。

其计算原理是什么。通过减去中值,中值间的所有差异均已减去,因此组间的唯一区别是其变异性。

为何减去每组的中值,而非平均值?如果减去列平均值而非列中值,则该检验称为 等方差Levene检验。哪种更好?如果分布不完全服从高斯分布,则取决于分布的内容。来自几组统计学家的模拟表明,使用中值可以很好地处理许多类型的非高斯数据。Prism只使用中值(Brown - Forsythe)而非平均值(Levene)。

解读结果

如果P值较小,则必须决定是否得出群体标准偏差不同这一结论。显然,等方差检验只以这一项实验的数值为基础。在得出结论之前,应考虑其他类似实验的数据。

如果您得出群体方差不同这一结论,则有四个选择:

得出群体不同这一结论。在许多实验环境中,发现不同标准偏差与发现不同平均值同样重要。如果标准偏差确实不同,则不论方差分析对平均值之间差异得出什么结论,群体均不同。这可能是实验中最重要的结论。

转换数据以使标准偏差相等,然后重新运行方差分析。通常会发现将数值转换成其倒数或对数会使标准偏差相等,也使分布更加高斯化。

使用Welch或Brown - Forsythe版本的单因素方差分析,不假设所有标准偏差均相等。

切换到非参数Kruskal - Wallis检验。问题是,如果各组标准偏差非常不同,则很难解释Kruskal - Wallis检验的结果。如果标准偏差非常不同,则分布的形状也非常不同,且不能将kruskal - Wallis结果解读为比较中值。

R2 R平方是归因于各组平均值之间差异的总变异的分数(所有数据,汇集所有组)。其比较了各组平均值之间的变异性和组内的变异性。较大值意味着大部分变异因限定研究组的治疗方法所致。R2 值由方差分析表计算得到,等于各组间平方和除以总平方和。一些程序(和书籍)未报告该值。其他程序称之为 η2(η²),而非R2。这是一个描述性统计数据,量化了群体成员与测量变量之间的关系强度。

参考文献

J.H. Zar,《生物统计分析》,第5版,2010,ISBN:0131008463。

© 1995-2019 GraphPad Software, LLC. All rights reserved.