Please enable JavaScript to view this site.

何时使用二项式检验而不是卡方检验

二项式检验是一种精确检验,用于在只有两个类别(因此只输入了两行数据)时比较观察到的分布和预期的分布。在这种情况下,卡方检验只是一种近似值,建议改用精确二项式检验。

本示例

假设你的理论认为某一事件发生的概率为 20%。事实上,在一个重复 100 次的实验中,该事件只发生了 7 次。你预计该事件会发生 20 次(100 次的 20%),但它只发生了 7 次。这是多么罕见的巧合?这就是二项式检验要回答的问题。

创建一个整体部分表,在第 1 行输入 7,在第 2 行输入 93,并根据需要在行上标注。单击 "分析",在 "整体部分"部分选择 "比较观察到的分布和预期的分布"。输入期望值(20 和 80)并选择二项式检验(而不是卡方检验)

Prism 会报告单尾和双尾 P 值。

单尾 P 值

单尾 P 值(也叫单边 P 值)简单明了。零假设是预期结果来自一个正确的理论。因此 P 值回答了这个问题:

如果真实比例是 20%,那么在 100 次试验中观察到 7 个或更少的事件的概率是多少?

之所以要加上 "或更少",是因为如果 100 次试验中观察到的事件数少于 7 个,那就更令人惊讶了。

本示例的单尾 P 值为 0.0003.

如果观察值小于期望值,Prism 会报告单尾 P 值,即观察到该事件数或更少的概率。如果观察值大于期望值,Prism 会报告单尾 P 值,即观察到这么多或更多事件的概率。

双尾 P 值

双尾 P 值比较难定义。事实上,有(至少)三种方法来定义它。

Prism 使用下面的第三个定义,这是 Prism 创建摘要时使用的 P 值(* 或 **......)。

单尾 P 值的两倍。0.0002769 的两倍等于 0.0005540 这似乎很合理,但并没有使用这种方法。除非期望值比例为 50%,否则二项分布的不对称性使得简单地将单尾 P 值加倍是不明智的。

与预期距离相等。理论上预计会发生 20 起事件,而我们观察到的是 7 起。我们观察到了 7 个事件,差异为 13 (20-7)。因此,分布的另一个尾部应该是获得 20+13=33 个或更多事件的概率。用这种方法计算的双尾 P 值是获得 7 个或更少的概率(0.0002769;与单尾 P 值相同)加上获得 33 个或更多的概率(0.001550441),这意味着双尾 P 值等于 0.00182743。

小 P 值法。用这种方法来定义第二个尾数时,我们不走相同的距离,而是从一个同样不可能的值开始计算第二个尾数。当真实概率为 0.20 时,在 100 个事件中观察到 7 个事件的概率等于 0.000199023。获得 33 个事件的概率(另一种方法中对第二个尾部的定义)更高:0.000813557。获得 34 个事件的概率也更高。但观察到 35 个事件的概率略低(0.000188947)。因此,第二个尾数被定义为观察到 35 个或更多事件的几率。这个尾数是 0.0033609。因此,双尾 P 值为 0.00061307。这就是 Prism 使用的方法。

第二种方法和第三种方法之间的区别很微妙。第一个尾数是明确的。它从 7 开始,一直到 0。第二个尾部是对称的,但有两种定义方法。第二种方法是围绕计数对称。换句话说,该尾部的边界(33)与期望值 20 的距离与观察值 7 的距离一样远(33-20=20-7)。第三种方法是概率对称法。 假设真实概率为 20%,因此我们预期观察到 20 个事件,观察到 7 个事件的概率与观察到 35 个事件的概率大致相同。因此,第二个尾数就是观察到 35 个或更多事件的概率。

如果预期概率为 0.5,二项分布是对称的,三种方法得出的结果相同。当预期概率为 0.5 时,则二项式检验与 符号检验相同。

© 1995-2019 GraphPad Software, LLC. All rights reserved.