本示例来自优秀的在线统计学教材《如何避免和检测统计渎职》。该研究评估了两种病媒控制方法与无控制方法对牛的充盈细胞体积 (PCV) 的影响。三个牛群被随机分配到三种处理方法中的每一种。从每个牛群中抽取四头奶牛的血样,并将充盈红细胞体积制成表格。
我们关注的因素是治疗。嵌套因素是牛群。每个牛群只接受一次治疗,因此牛群在治疗中是嵌套的。
之所以说这种设计是嵌套的,是因为每个牛群要么是对照组,要么是以一种方式接受治疗的牛群。您不能问是否有些牛群对治疗的响应者比其他牛群更好,因为每个牛群只得到了一种可供选择的治疗方法。牛群被称为治疗中的嵌套。
这也叫分层设计。分层和嵌套是描述这种设计的同义词。
将这些数据视为三个处理组中的每组 n=12,这很有诱惑力,但并不恰当。
如果对这些数据进行单因素方差分析,结果将毫无意义。方差分析假定每个值都提供了独立的信息。三个牛群为每个处理组提供信息,每个牛群有四头奶牛的数据。每个处理没有十二个独立的测量值。与其他牛群的奶牛相比,一个牛群中每头奶牛的重复数据更接近。
如果这样分析数据,P 值几乎肯定会太小,均值间差异的置信区间也会太窄。
如果没有缺失值,可以用单向方差分析来分析数据。第一步是平均每个牛群的技术重复。然后将这些平均值输入新的表格,再用单因素方差分析比较三组平均值。
请注意,在单因素方差分析中,每个处理组的三个牛群堆叠在一列,但在嵌套 t 检验中则并列在子列中。
如果没有缺失数据,这些均值数据的单因素方差分析将与整个数据集的嵌套单因素方差分析相同。