二项式检验是一种精确检验,当只有两个类别时(因此只输入了两行数据),将观察到的分布与预期的分布进行比较。在此情况下,卡方只是一个近似值,我们建议使用精确二项式检验。
示例
假设您的理论认为某事件的发生几率应该为20%。事实上,在一个有100条重复数据的实验中,该事件只发生了7次。您预计事件会发生20次(100中的20%),但只发生了7次。这种巧合有多罕见?这是二项式检验要回答的问题。
创建一个全部部分表,在第1行输入7,在第2行输入93,如果您愿意,可以标记这些行。点击“分析”,并选择将观察到的分布与整个部分中的预期分布进行比较。输入期望值(20和80)并选择二项式检验(而非卡方检验)
Prism报告单侧和双尾P值。
单尾P值(又称“单侧P值”)很简单。零假设预期结果来自正确的理论。因此,P值回答了该问题:
如果真正的比例是20%,则在100次试验中,您观察到7次或更少事件的几率是多少?
您需要包括“或更少”,因为如果100次试验中的事件数少于7次,那就更令人惊讶了。
该示例的单尾P值为:0.0003。
如果观察到的值小于预期值,则Prism会报告单尾P值,即观察到许多或更少事件的概率。如果观察到的值大于预期值,则Prism会报告单尾P值,即观察到许多或更多事件的概率。
双尾P值有点难以定义。事实上,(至少)有三种定义方法。
Prism使用下文第三个定义,这是Prism创建摘要(*或**...)时使用的P值。
•将单尾P值加倍。两倍0.0002769等于0.0005540 这似乎十分明智,但未使用该方法。除非预期比例为50%,否则二项分布的不对称性会不明智地只是将单尾P值翻倍。
•与预期距离相等。该理论预计有20个事件。我们观察到了7个。差异为13(20-7)。因此,分布的另一个尾部应该是获得20+13 = 33个或更多事件的概率。以此方式计算的双尾P值是获得7或更小的概率(0.0002769;与单尾P值相同)加上获得33或更多的概率(0.001550441),这意味着双尾P值等于0.00182743..
•小P值法。为使用该方法定义第二尾部,我们不使用同样的距离,而是从同样不可能的值开始。真实概率为0.20时,准确观察到100个事件的7个事件的概率等于0.000199023。获得33个事件的概率更高(在另一种方法中如何定义第二尾部):0.000813557。获得34个事件的机会也更高。但是观察到35个事件的机会有点低(0.000188947)。因此,第二尾部定义为观察到35个或更多事件的机会。尾部为0.0033609。因此,双尾P值为0.00061307。这是Prism使用的方法。
第二种和第三种方法的区别很微妙。第一尾部较为明确。它从7开始,下降到零。第二尾部较为对称,但有两种定义方法。第二种方法是计数对称。换言之,该尾部(33)的边界与预期值20的之间距离同与观察值7之间的距离一样远(33 - 20 = 20 - 7)。第三种方法是关于概率对称。假设真实概率为20%,则我们预计观察20次,观察7次事件的机会与观察35次事件的机会大致相同。因此第二尾部是观察35次或更多事件的概率。
如果预期概率为0.5,二项式分布对称,则所有三种方法均会给出相同结果。预期概率为0.5时,二项式检验与 符号检验。