一组 t 检验和 Fisher LSD 检验的唯一区别是,t 检验只计算被比较的两组的集合标差,而费舍尔 LSD 检验则计算所有组的集合标差(从而提高检验力)。需要注意的是,与 Bonferroni、Tukey、Dunnett 和 Holm 方法不同,费雪 LSD 并不修正多重比较。
多重比较使用的是α的族状定义。显著性水平并不适用于每个比较,而是适用于整个比较族。一般来说,这增加了达到显著性的难度。这确实是多重比较的主要意义,因为它减少了被完全由随机抽样造成的差异所迷惑的机会。下面是一个本示例:
第一组 |
第二组 |
第三组 |
34 |
43 |
48 |
16 |
37 |
43 |
25 |
47 |
69 |
对第 1 组和第 2 组进行非配对 t 检验,计算出的 P 值为 0.0436,小于 0.05,因此具有统计学显著性。但在方差分析后进行 Tukey 多重比较检验,计算出的多重调整 P 值为 0.1789,在统计学上不显著。
在某些情况下,增加 df(通过汇集所有组的 SD,即使只比较两个组)的效果会克服多重比较对照组的效果。在这种情况下,您可能会在多重比较检验中发现 "显著 "差异,而在简单的 t 检验中却发现不了。本示例如下:
第一组 |
组 2 |
第三组 |
34 |
43 |
48 |
38 |
45 |
49 |
29 |
47 |
47 |
通过非配对 t 检验比较 1 组和 2 组,得出的双尾 P 值为 0.0164,而 Tukey 多重比较检验计算出的多重调整 P 值为 0.0073。如果我们将本示例的 "显著性 "阈值设为 0.01,则用 t 检验的结果不具有 "统计学显著性",但用多重比较检验的结果具有统计学显著性。
当您要求 Prism 使用 FDR 方法(使用三种方法中的任何一种)时,它会首先使用 Fisher LSD 方法(如果您假设从高斯分布中取样)或未校正邓恩检验(非参数)计算 P 值。这些方法不修正多重比较。
然后,这三种方法决定其中哪些 P 值足够小,可以称为 "发现",阈值取决于 P 值的分布、P 值的数量以及您选择的三种方法中的哪一种。
第一步,计算 P 值与传统的 t 检验值非常接近。第二步,决定哪些是 "发现"则大不相同。