在分类预测变量作为预测因子纳入回归模型中时,Prism会使用“虚拟编码”自动对该变量进行编码。该过程(在幕后)会产生许多新的变量,数量等于原始分类变量的级数减一。例如,如果某个分类变量具有5个独特水平(A、B、C、D和E),则虚拟编码将生成4个新的变量。如果某个分类变量只有2个独特的水平(例如,女性和男性),则虚拟编码将只生成1个变量。以此方式,分类预测变量的每一水平(一个除外),得到一个用于回归分析的新变量。此外,计算得到的β回归系数用于每一个新变量。
但这些β系数代表什么?以及哪项水平未获得新变量?这些问题均与分类预测变量的参考水平的概念有关。
分类预测变量的参考水平通常视为给定变量观察到的“基线”或“正常”值。在虚拟编码的过程中,删除参考水平的变量,因为对于每个观察结果,它只包含“0”。作为替代,参考水平用作所生成的回归模型的说明方式。让我们用一个示例来明确说明这一点:
考虑一个模型,其中包括分类预测变量“性别”,水平为“男性”和“女性”。如果“男性”是我们的参考水平,则预测模型将包括“女性”的β系数(与风险比),但不包括“男性”的β系数(和风险比)。在此情况下,“女性”的风险比告诉我们女性风险比是男性的多少倍,保持所有其他变量不变。换言之,如果“女性”的风险比是3.658,则女性风险比预计是男性的3.658倍。请注意,这种解释也可以直接应用于参数估计(β系数),但“对数风险”的想法并不直接直观,因此我们在解释这些值时通常使用风险比(等于exp(β)),而非β。
在“参考水平”选项卡上,回归模型中包含的每个分类预测变量将列在“定义参考水平”下。对于每个变量,您可以选择让Prism自动定义参考水平(基于指定规则)或手动定义水平。自动指定参考水平时,可从许多规则中选择可供Prism使用的规则,其中包括:
•第一级水平(默认)。Prism将选择数据表中变量的第一级水平。请注意,如果数据表中的行顺序发生变化,该参考水平也可能发生变化!
•最后一级水平。Prism将选择数据表中变量的最后一级水平。请注意,如果数据表中的行顺序发生变化,该参考水平也可能发生变化!
•最常见的水平。Prism将确定变量中最常出现的水平,并将其用作参考水平。如果您希望回归系数提供罕见水平的影响与普通水平相比的信息,这是很好的选择。请注意,更改数据表中的行顺序不会导致此参考水平发生变化。然而,添加或删除数据可能会导致参考发生变化(通过改变每个水平的频率)
•最不常见的水平。Prism将确定变量中最少出现的水平,并将其用作参考水平。请注意,更改数据表中的行顺序不会导致此参考水平发生变化。然而,添加或删除数据可能会导致参考发生变化(通过改变每个水平的频率)
对于上文用于指示Prism应如何自动选择参考水平的各项规则,数据的某些更改(组织或添加/删除数据)可能会导致自动选择的水平发生改变。例如,如果您选择“最后水平”规则供Prism使用,并在表格底部添加新的数据行,则数据表中的“最后水平”可能会改变!“参考水平”选项卡底部附近提供有复选框,用于“在数据更改时重新计算自动参考水平”。默认情况下,此框处于选中状态。但如果您希望确保数据更新时参考水平不变,可以取消选中此框。未选中时,您仍然可以使用规则让Prism检查相应的水平,但在点击“确定”后,对数据的更改将不会导致对指定参考水平的任何更改(打开“参考水平”选项卡并重新分配规则之前,Prism不会进行“重新检查”)。
最后,您也可以选择通过选择第一个下拉菜单中的“自定义…”以及选择第二个下拉菜单中的所需水平来指定自定义参考水平。
在生成回归分析的结果输出时,Prism将按照分类预测变量在数据表中出现的顺序显示它们的水平。然而,出于演示或发表目的,有时更改回归模型中一个或多个特定分类预测变量的水平顺序可能有用。“定义参考水平”部分中的“顺序”按钮允许您分别自定义每个分类变量的水平顺序。“定义分类顺序”子菜单中的控件允许您:
•将分类变量的参考水平设置为当前选定水平
•手动重新对水平进行排序(顶部、向上、反向、向下和底部控件)
•使用三种默认方法之一对水平进行重新排序:
▪可视顺序:水平首次出现在数据表中的顺序
▪频率:频率较高的水平在顺序中位置较高
▪辞典编纂:使用辞典编纂的顺序来排列顺序。类似于字母顺序,但请注意,名为“a100”的水平将排在“a90”之前,因为“1”在“9”之前。该顺序不考虑整个数字“100”大于整个数字“90”的事实
默认情况下,分类变量的参考水平被选为数据表中该变量的第一级。Prism还提供了其他自动选择,包括“最后一级”、“最常见级”和“最不常见级”。然而,如果输入数据发生变化(或者如果附加数据添加到输入数据表),一些自动选择也可能发生变化。为确保输入数据发生变化或添加额外数据时指定的参考水平不会发生变化,请取消选中“数据发生变化时重新计算自动参考水平”旁边的对话框,或使用适当的下拉菜单将单个参考水平设置为“自定义...”。