Please enable JavaScript to view this site.

Navigation: 统计学原理 > 等效性检验

检测置信区间或P值的等效性

Scroll 前一页 Top 后一页 More

在检验等效性之前,您必须首先定义一系列您认为在科学上或临床上不重要的治疗效果。您必须根据科学或临床判断,设定该范围 - 统计分析无帮助。

如果您观察到的治疗效果超出该科学或临床无差异的范围,则很明显,您不能得出治疗等效的结论。

如果治疗效果确实在临床或科学无差异的范围之内,则您可查看数据是否足够紧密,从而得出治疗效果等效的强有力结论。

检验带有置信区间的等效性。

下图显示检验带有置信区间的等效性逻辑。横轴表示治疗效果的绝对值(平均值反应之间的差值)。实心圆圈表示观察效果,该效果在无差值区域内。水平误差条显示单侧95%置信区间,其显示与数据一致的最大治疗效果(95%置信)。

在顶部所示的试验中,即使是置信区间的极限,也在无差值区域内。您可得出结论(95%置信),这两种治疗方法等效。

在底部显示的试验中,置信区间超出无差值区域。因此,您不能得出治疗等效的结论。您也不能得出治疗非等效的结论,因为观察到的治疗是在无差值区域内。通过此类数据,您根本无法就等效性得出任何结论。

使用统计假设检验,进行等效性检验

非常直接的想法是考虑具有置信区间(如上)的统计等效性。将统计假设检验的想法应用到等效性会变得更加复杂。

统计假设检验从一个零假设开始,然后询问您是否有足够的证据,拒绝那个零假设。您寻找差值时,零假设是没有差值。通过等效性检验,我们正在寻找两种治疗方法等效的证据。因此,在此情况下,“零”假设是治疗并不等效,而是差值仅仅勉强大到足以超出科学或临床无差值的范围。

在上图中,将零假设定义为真实效果等于虚线表示的效果。然后询问:如果零假设为真,则观察到效果与观察到的效果一样小或更小的概率(给定样本量和变异性)是多少。如果P值很小,则可否定零假设(不等效),并因此得出结论:治疗等效。如果P值很大,则数据与零假设(效果不等效)一致。

由于您只关心获得比零假设低得多的效果概率(如果差值更大,不做检验),因此使用单尾P值。

使用水平轴上的效果绝对值绘制上述图表。如果您需要绘制治疗效果,则将会有两条虚线,围绕0点对称,其中一条是显示积极治疗效果,另一条则显示消极治疗效果。然后您会有两个不同的零假设,每个假设均使用单尾检验进行检验。您会看到这被称为 两个单侧检验程序(1,2)。

这两种方法等效

当然,使用95%置信区间方法(使用单侧95%置信区间)和假设检验方法(使用单侧0.05阈值作为显著性)完全等效,因此总是给出相同结论。在我看来,置信区间更容易理解。

使用Prism检验等效性

Prism没有任何内置的等效性检验。但您可使用Prism进行计算:

1.使用t检验比较两组(配对或非配对,取决于实验设计)。

2.选中创建 90% 置信区间的选项。这是右侧的90%,而非95%。

3.如果整个 90% 置信区间范围位于您定义的无差值区域内,则您可确定地得出结论,且 有95%的信心认为 两种治疗等效。

是否对从90%置信区间转换到95%确定性结论感到困惑?良好。这意味着您正在关注该问题。其令人 困惑!

参考文献

1.D.J. Schuirmann,两种单侧检验程序的比较和评估平均生物利用度等效性的检验力方法,《药代动力学和药效学杂志》,115:1567,1987。

2.S. Wellek,检验等效性的统计假设,Chapman和Hall/CRCm,2010,ISBN:978-1439808184。

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.