频率分布是观察值数量的函数图。累积频率分布是观测值的累积数量与观测值的函数关系图。每个 Y 值是原始数据集中值小于或等于 X 值的观察值的数量。
创建累积分布的优势在于,您无需就箱宽做出任何选择。
如果您的数据服从高斯分布,则累积分布具有正余弦形状。
1.创建 XY 表格,输入 X 值和 Y 值。X 值对应原始数据集中的值,Y 值是原始数据集中小于或等于 Y 值的值的数量(或分数或百分比)。
替代方法是在列数据表中输入数值堆,然后运行频率分布分析,选择创建无分隔的累积频率分布。
2.在累积频率分布中点击分析,选择非线性回归,然后从 "高斯"方程组中选择累积高斯分布方程之一。
3.如果输入的数据是计数(而不是百分比或分数),请将 N 约束为与观察值相同的常数。
模型的细节依赖于 Y 值是百分比、分数还是计数。
下面是数据为百分比时的模型,因此最后一个 Y 值等于 100。
顶部=100
z=(X-Mean)/SD
Y=Top * zdist(z)
下面是数据为分数时的模型,因此模型的第一行定义 Top 等于 1.00。
Top=1.0
z=(X-Mean)/SD
Y=Top * zdist(z)
最后,如果数据是观察值,那么最大值等于观察值(N)。在这种情况下,应将 N 限定为与观察值相等的常数。
z=(X-Mean)/SD
Y=N * zdist(z)
平均值是原始分布的平均值,频率分布就是根据原始分布创建的。
SD是原始分布的标准偏差。
这两个参数的单位都与图表上绘制的 X 值相同,即与据以生成频率分布的原始分布中的 Y 值相同。