这些方法中的有一些允许您计算置信区间和多重性调整后P值,有些则不允许。我们建议使用其中一种计算置信区间和多重性调整后P值的检验,原因有二:
•对大多数人而言,置信区间比有关统计学显著性的说法更容易解读。
•多重性调整后P值可提供更多信息,简单地知道差异是否视为具有统计学显著性。
可用检验列表取决于您在第二个选项卡上指定的目的。我们建议使用这些检验,因为这些检验可计算置信区间和多重性调整后P值
•如果您要比较每行(或每列)平均值与其他每行(或其他每列)平均值,则我们建议使用Tukey检验。
•如果您要比较对照行(或列)平均值与其他行(或其他列)平均值,则我们建议使用Dunnett检验。
•如果您正在比较一堆独立比较,则我们建议使用Sidak方法,该方法与Bonferroni非常相似,但检验力稍高一些。
此外,由于历史原因,Prism还提供 Newman - Keuls检验 (因此,用旧版Prism制作的文件将会打开)(在比较每个平均值与其他每个平均值时),但我们建议您避免这样做,因为该检验不将族状错误率保持在指定水平(1)。在某些情况下,I型错误的几率可能大于您指定的α水平。
Prism提供了三种方法用于控制错误发现率。所有均决定将哪些(如有)比较标记为“发现”,且如此操作的方式可控制错误发现率小于您输入的值Q。
FDR方法不经常用作方差分析的后续检验,但缺少这样做的充分理由。
如果您选择该方法,则Prism将执行Fisher最小显著性差异(LSD)检验。
该方法(Fisher LSD)检测差异的检验力更高。但该方法可能得出错误结论,即差异具有统计学显著性。修正多重比较(Fisher LSD不执行)时,显著性阈值(通常为5%或0.05)适用于整个比较族。在使用Fisher LSD的情况下,该阈值分别适用于每项比较。
仅当您有充分理由时方可使用Fisher LSD方法,您在报告结果时要小心解释您进行的操作。
该选项的唯一影响是会改变所有报告的平均值间差异的符号。如果选中该选项,则2.3的差异将为 - 2.3。如果选中该选项,则 - 3.4的差异将为3.4。这纯粹是个人偏好,取决于您对数据的看法。
如果您选择了Bonferroni、Tukey或Dunnett多重比较检验,则Prism还可报告多重性调整后P值。如果选中该选项,则Prism会为每项比较报告调整后P值。这些计算不仅考虑到所比较的两组,还考虑到方差分析中的组总数(数据集列)以及所有组中的数据。
多重性调整后P值是适用于整个比较族的最小显著性阈值(α),在该阈值下,特定比较将(仅勉强)声明为“统计学显著性”。
直至最近,仍不常报告多重性调整后P值。如果您选择让Prism来计算这些值,则花些时间确保您理解这些值的意思。如果您在出版物或演示文稿中包含这些值,则务必解释这些值是什么。
按照传统,置信区间针对95%置信计算得出,统计学显著性使用等于0.05的α来定义。Prism允许您选择其他值。如果您选择FDR,则为Q选择一个值(百分比)。如果您将Q设为5%,则您预计不超过5%的“发现”为假阳性。
1.SA Glantz,《生物统计学初级读本》第六版,ISBN = 978 - 0071435093。
2.MA Seaman、JR Levin和RC Serlin,《心理学通报》110:577 - 586,1991。