Please enable JavaScript to view this site.

析(ANOVA)是一种统计技术,用于比较三个或更多组的均值。

当所比较的组可由单个分组因素定义,且每组的受试者在其他组中并无重复或匹配时,使用普通的单因素方差分析(有时称为“单因子方差分析”)。例如,您可能希望将对照组与药物治疗组以及同时接受药物和拮抗剂治疗的组进行比较。或者,您也可能希望比较五个组,每组都接受不同的药物。对于该试验,测量数据仅来自分配至一个组的受试者(并且与其他组中的受试者不匹配)。在所有情况下,均假设从中采集受试者或样本的总体遵循正态(高斯)分布。

为什么称为“普通”?这是一个统计学术语,意味着数据未配对或无匹配。配对或匹配数据的分析使用“重复测量”或“混合模型”方差分析。

为什么称为“单因素”?原因在于这些值是以一种方式或按一项因素进行分类。在本例中,因素是药物治疗。双因素设计将通过两个分组因素对值进行分组。例如,可以分别在男性和女性(性别)中对三种治疗(药物治疗)中的每一种进行测试。

为什么称为“方差”?方差是量化变差的一种方法。通过比较(“分析”)组内变差和组均值之间的变差,进行方差分析。对于单组值,方差等于标准差的平方。稍后,我们将看到其等于值的平方和除以自由度。

方差分析的工作原理

通过比较组内变差和组均值之间的变差,进行方差分析。

平方和

方差分析的第一步是计算数据中的平方和并将其分为三部分:

1.总平方和。即,每个值与所有数据的总均值之差的平方和。有时称为“SST”

2.组内平方和。首先计算每个值与该组均值之差的平方和。然后将这些值相加(对于所有组)。其称为“列内”平方和,有时又称为误差平方和(SSE)或内平方和(SSW)

3.组间平方和。对于每个组,计算数据组均值与总均值之差的平方。然后将这些值乘以相应组的样本量。然后再将这些值相加。其称为“列间”平方和,有时又称为回归平方和(SSR)或间平方和(SSB)

不出所料,组内平方和与组间平方和加起来等于总平方和。

另一种思考方式是:组间平方和代表治疗引起的变异性,而组内平方和则是您预计将在不同个体样本中看到的一般变异性。

均方值

这些平方和值均与一定数量的自由度(df,根据受试者人数和组数量计算)相关联。通过将每个平方和除以相关的自由度,计算均方(MS)。这些值可视为方差(类似于上述定义,在该定义中,方差是标准差的平方)。不同于平方和值,组内均方和组间均方加起来并不等于总均方(很少计算)。  

零假设

如需理解P值(见下文),首先需要阐明零假设。对于单因素方差分析,零假设是指从中抽取数值的总体或分布均具有相同的均值。此外,方差分析还假设这些总体或分布是具有相等标准差的高斯(正态)分布。

F统计量(F比率)

方差分析的F统计量等于组间均方除以组内均方的比值。

如果零假设为真,则预计组间方差与组内方差将大致相同。换言之,如果零假设为真,预计F统计量将接近1.0(即组间方差与组内方差大致相同)。另一方面,如果组别分配(在本例中,药物治疗)确实对测量结果存在影响,则预计组间方差将大于组内方差。因此,预计F统计量将大于1.0。

P值

在考虑数值数量和组数量的情况下,根据F比率确定P值。回想一下,单因素方差分析的零假设是指所有总体均值均相同。P值可回答以下问题:

如果零假设为真(所有组均从具有相同均值的分布或总体中抽样),那么,仅因随机抽样变异性而导致观察到F比率较大或大于您所计算的F比率的概率是多少?

如果总体P值很大,则数据不会给您任何理由得出样本来自不同的总体均值这一结论。即使总体均值相等,您也不会惊讶于偶然发现样本均值如此遥远。这不等于说真正的均值均相同。您只是缺失令人信服的证据来证明这些均值不同。

如果总体P值很大:则数据不会给您任何理由得出样本来自不同的总体均值这一结论。即使总体均值相等,您也不会惊讶于偶然发现样本均值如此遥远。这不等于说真正的均值均相同。您只是缺失令人信服的证据来证明这些均值不同。

如果总体P值很小:则可得出结论:数据抽样所来自的总体均值不太可能相等。这并不意味着每个均值均不同于其他均值,只是至少有一个均值可能不同于其他均值。观察多重比较跟进检验的结果,找出差异。

当然,这些结论仅为初步结论,随机抽样会导致两个方向都存在误差。

等方差检验

方差分析基于如下假设,即:数据抽取自具有相同方差的总体(由于方差是标准差的平方,相当于说其具有相同的标准差)。Prism使用两种检验来测试该假设。其计算Brown-Forsythe检验,以及(如果每个组至少有五个值时)计算Bartlett检验。未提供是否运行这些检验的选项。Prism会自动这样做,并始终报告结果。

这两种检验均计算了旨在回答该问题的P值:

如果总体确实具有相同方差(或标准差),那么,仅因随机抽样变异性而导致样本方差不同于您在样本中观察到方差不同的概率是多少?

请勿将这些方差相等的P值检验与均值相等的P值检验混淆。

Bartlett检验

Prism报告“纠正”Barlett检验的结果,如Zar(1)第10.6节中所述。如果数据确实从高斯分布抽样得到,则Bartlett检验的效果很好。但如果分布稍微偏离高斯分布,即使标准差之间的差异很小,则Bartett检验也可能报告较小P值。出于该原因,很多人不推荐该检验。这就是我们增加Brown和Forsythe检验的原因。  其目标与Bartlett检验相同,但对正态性的轻微偏离不太敏感。我们建议您注意Brown-Forsythe结果,忽略Bartlett检验(我们在此保留该检验的目的是与Prism的先前版本保持一致)。

Brown-Forsythe检验

Brown-Forsythe检验的概念很简单。数据表中的每个值均通过减去该列的中值进行变换,然后取差值的绝对值。对这些值进行单因素方差分析,方差分析的P值作为Brown-Forsythe检验的结果报告。

其计算原理是什么?通过减去中值,中值间的所有差异均已减去,因此组间的唯一区别是其变异性。

为何减去每组的中值,而非均值?  如果减去列均值而非列中值,则该检验称为Levene方差齐性检验。哪种更好?如果分布不完全服从高斯分布,则取决于分布的内容。来自几组统计学家的模拟表明,使用中值可以很好地处理许多类型的非高斯数据。Prism只使用中值(Brown-Forsythe),不使用均值(Levene)。

结果解读

如果方差齐性检验的P值较小,则必须决定是否得出总体标准差不同这一结论。显然,等方差检验只以这一项实验的数值为基础。在得出结论之前,考虑一下其他类似实验的数据。

如果您得出总体方差不同这一结论,则有四个选择:

得出总体不同这一结论。在很多实验环境中,发现不同标准差与发现不同均值同样重要。如果标准差确实不同,则不论方差分析对均值之间差异得出什么结论,总体均不同。这可能是实验中最重要的结论。

转换数据以使标准差相等,然后重新运行方差分析。通常会发现将数值转换成其倒数或对数会使标准差相等,也使分布更加高斯化。

使用Welch或Brown-Forsythe版本的单因素方差分析,不假设所有标准差均相等。

切换到非参数Kruskal-Wallis检验。问题是,如果您的各组标准差非常不同,则很难解释Kruskal-Wallis检验的结果。如果标准差非常不同,则分布的形状也非常不同,且不能将Kruskal-Wallis结果解读为比较中值。

R2是指归因于各组均值之间差异的总变差的分数(所有数据,汇集所有组)。其比较各组均值之间的变异性和组内的变异性。较大值意味着大部分变差因限定研究组的治疗方法所致。R2值由方差分析表计算得到,等于各组间平方和除以总平方和。一些程序(和书籍)未报告该值。其他人将其称为“η2(eta平方)”,而非“R2”。该参数为描述性统计量,用于量化组成员与测量变量之间的关系强度。

参考文献

J.H. Zar,《生物统计分析》,第5版,2010,ISBN:0131008463。

© 1995-2019 GraphPad Software, LLC. All rights reserved.