Please enable JavaScript to view this site.

t检验假设方差相等

标准非配对t检验(但不是Welch t检验)假设两组数据从具有相同标准差的总体中抽取,因此方差相同,即使其均值不同,亦如此。

检验两组样本是否来自方差相等的总体

作为t检验分析的一部分,Prism使用F检验,检验这一假设,从而比较两组的方差。请注意,Prism和InStat的早期版本中存在一个错误,给出的F检验的P值过小,相差两倍。

请勿混淆组标准差相等性的P值检验与均值相等性的P值检验。后一个P值回答您在选择t检验或单因素方差分析时最有可能想到的问题。检验方差相等性的P值可回答该问题:

如果总体确实具有相同方差(或标准差),那么,仅因随机抽样变异性而导致样本方差不同于您在样本中观察到方差不同的概率是多少?

如果方差不同,应如何做

如果P值很小,则拒绝零假设,即,两组均为从具有相同标准差(因此具有相同方差)的总体中抽样。

然后呢?有五种可能答案。

得出总体不同这一结论。在很多实验环境中,发现不同标准差与发现不同均值同样重要。如果标准差不同,则不论t检验得出的均值之间差异的结论是什么,总体不同。将这种差异作为解决方法的障碍之前,先考虑一下其是否有助于解释数据。这可能是实验中最重要的结论!还要考虑具有较大标准差的组是否具有异质性。如果将一种治疗应用于该总体,也许只对约一半受试者有效。

转换数据。在很多情况下,转换数据可使标准差相等。如果可行,可对转换后的结果运行t检验。对数特别有帮助。(有关示例,请参见《直觉生物统计学》第46章)。从对数正态分布中进行数据抽样时,对数转换是一种合适方法。在其他情况下,倒数或平方根转换可能有帮助。当然,理想情况下,应作为试验设计的一部分,对转换作出规划。

忽略结果。对于相等或几乎相等的样本量(以及中等大小的样本),等标准差的假设并非重要假设。即使标准差不相等,t检验也能良好发挥作用。换言之,只要样本量不是很小,且样本量之间的差距也不是很大,则检验能够有效抵消违反假设的行为。如果您想使用普通的t检验,利用您实际使用的样本量和您预期的方差差异进行模拟,查看t检验的结果是否严重偏离。

返回并重新运行t检验,检查允许不等方差的Welch t检验选项。尽管这听起来很合理,但Moser和Stevens已表明事实并非如此。如果您使用F检验,比较方差以决定使用哪一种t检验(常规或Welch),您将增加出现I型误差的风险。即使总体相同,您也会得出结论,总体的差异超过5%。Hayes和Cai得出同样的结论(2)。Welch检验必须被指定为试验设计的一部分。

使用置换检验。GraphPad程序不提供这样的检验。该想法是将观察值当作特定值,并询问这些值在两组中的分布情况。在两组之间随机打乱数值,保持原始样本量。对于打乱的数据集,哪一部分在均值与观察值之间有大(或更大)差异。即P值。当不同总体的标准差不同时,该检验仍产生相当准确的P值(良好做法,参考下文,第55页)。这些检验的缺点是其不容易产生置信区间。有关更多信息,请访问Wikipedia,或者Hyperstat。  

能否转而使用非参数Mann-Whitney检验?乍看之下,这似乎是解决不平等标准差问题的适当办法。但实则不然!Mann-Whitney检验可检验秩分布是否不同。如果您知道标准差不同,则代表您已知道分布不同。您可能仍想知道均值或中值是否不同。但各组具有不同分布时,非参数检验不检验中值是否不同。这是一个常见误解。

如何避免该问题

以上解决方案均并非很好的解决方案。最好可避免该问题。

避免该问题的一种方法是清楚地考虑数据的分布,并将数据转换为日常数据处理的一部分。如果您了解系统创建对数正态数据,请始终分析对数。

另一解决办法是始终使用不等方差(Welch)t检验。如上所述,首先检验不相等的标准差,并以此结果为基础,决定是否使用普通或修正的(不相等的方差,Welch)t检验,这并非良好做法。但总是使用修改后的检验是否有意义?Ruxton提出一个强有力的案例,证明这是最佳办法(3)。Delacre亦如此(4)。标准差实际上相等时,您会失去一些检验力,但标准差不相等时,您会获得检验力。

Welch t检验提出一系列奇怪假设。对于两个总体而言,均值相同但标准差不同意味着什么?为何要对此进行检验?Swailowsky指出,这种情况在科学中很少出现(5)。我更喜欢将不等方差t检验作为一种建立置信区间的方法。首要目的并非询问两个总体是否不同,而是量化这两个均值之间的差异有多大。不等方差t检验报告两个均值之间差值的置信区间,即使标准差不同,该区间也可用。

参考文献

1.Moser, B.K.和G.R. Stevens,在两样本均值检验中的方差同质性,《美国统计学家》,1992;46(1):19-22。

2.Hayes和Cai,进一步评估用于比较两个独立均值的条件决策规则,《Br J Math Stat Psychol》(2007)

3.Ruxton,不等方差t检验是Student t检验和Mann-Whitney U检验的一种未得到充分利用的替代方法,《行为生态学(2006)》第17卷(4)第688页

4.Delacre,M.、Lakens,D.L.和Leys,C.(2017),为何心理学家应默认使用Welch t检验而非Student t检验,Rips 30: 92-10。

5.S.S. Sawilowsky、 Fermat、Schubert、Einstein和Behrens - Fisher:具有不同方差的两个均值之间的可能差异,《现代应用统计方法杂志》(2002)第1卷,第461-472页

6.P.I. Good和J.W. Hardin,统计学中的常见错误:(以及如何避免),2003,IBSN:0471460680。

© 1995-2019 GraphPad Software, LLC. All rights reserved.