假设你有兴趣根据足球踢球手踢球的距离来预测他们是否能踢好某一球。您知道,踢球的距离对决定踢得好坏起着重要作用,因此,开始时,您可能会从不同距离收集一些有关踢球者能力的初始数据。为此,您可以让踢球者尝试从不同距离踢一个界外球(在本示例中,我们假设任何一次尝试都不会对其他尝试产生影响)。这个初始测试的结果可能如下所示:

你可以看到,这些数据似乎支持你的假设,即距离对射门尝试是否成功有一定影响:踢得较短的球都成功了,而踢得较长的球都没进。事实上,你可以看到所有超过 30 码的射门都没有命中。这个数据代表了完美分离。在另一页描述完美分离时,有人指出完美分离并不一定是坏事。它可能仅仅意味着你有一个变异性(在本例中是距离),可以用来完美预测结果(在本例中是射门尝试是否成功)。
但问题是...
在本示例中,我们的射手完全有可能在 30 码以上的距离射门得分,而我们只是没有收集到足够的数据。如果我们重复这个实验,但在每个距离收集多次尝试的结果(再次假设每次尝试实际上都是独立于其他尝试的),我们的数据可能会是这样的:

这些数据不再存在完美分离的问题,而且能让我们更好地了解踢球者在不同距离上可能的表现。事实上,利用这些数据,我们可以确定我们的踢球者在刚刚超过 34 码的距离上成功踢进一球的几率是均等的(1:1 的几率或成功概率 = 50%)(Prism 将此数据报告为 "X at 50%")。