许多统计学书籍均从对您可能想要分析的各种变量进行定义开始。该方案由Stevens提出,并于1946年发表。
. 分类变量(又称“名义变量”)彼此互斥,但不是序数类别。例如,您的研究可能会比较五种不同的基因型。如果您愿意,您可用数字来对这五种基因型进行编码,但顺序任意,任何计算(例如,计算平均值)均无意义。
. 序数变量是一个顺序重要但值之间的差异不重要的变量。例如,您可要求患者用1 - 10分的评分来表达他们感受到的疼痛程度。7分意味着疼痛程度高于5分,5分高于3分。但7分和5分之间的差别可能与5分和3分之间的差别不同。这些值只是表示一个顺序。另一个示例是影像分级,从*到*****。
. 区间变量是两个值之间的差异有意义的变量。100度和90度的温差与90度和80度的温差相同。
. 比率变量具有区间变量的所有属性,但也有关于0.0的明确定义。变量等于0.0时,该变量不存在。身高、体重、酶活性等变量是比率变量。温度,用℉或℃表示,不是比率变量。在这两个标度中,0.0的温度并不意味着“没有热量”。然而,开尔文的温度是一个比率变量,因为0.0开尔文温度确实意味着“没有热量”。另一个相反示例是酸碱度它不是一个比率变量,因为酸碱值 = 0就意味着1摩尔的氢离子,而摩尔的定义相当随意。0.0的酸碱度并不意味着“没有酸度”(恰恰相反!)。使用比率变量而非区间变量时,您可查看两个测量值的比率。4克重量是2克重量的两倍,因为重量是比率变量。100 ℃不等于50 ℃的两倍热,因为温度不是比率变量。pH 3的酸性不是pH 6的两倍,因为pH 6不是一个比率变量。
以额计算.... |
标称 |
序数 |
区间 |
比率 |
频率分布 |
是 |
是 |
是 |
是 |
中值和百分位数 |
否 |
是 |
是 |
是 |
和或差 |
否 |
否 |
是 |
是 |
平均值、标准偏差、平均值的标准误差 |
否 |
否 |
是 |
是 |
比率或变异系数 |
否 |
否 |
否 |
是 |
如果您参加统计学考试,则它对于您而言很重要,因为它是一种容易考到的概念。
这对数据分析是否重要?这些概念非常浅显,但给不同种类的变量命名有助于防止出现错误,例如取一组邮政编码的平均值,或取两个酸碱值的比值。除此外,给不同种类的变量贴标签并不能真正帮助您计划您的分析或者解读结果。