不要使用这种方法:
首先进行正态性检验。如果 P 值较低,表明数据不服从高斯分布,则选择非参数检验。否则选择常规检验。
Prism 不使用这种方法,因为参数与非参数的选择比这更复杂。
•通常情况下,分析是一系列实验中的一个。由于要以相同的方式分析所有实验,因此不能依赖单一正态性检验的结果。
•许多生物变量都遵循对数正态分布。如果您的数据是从对数正态分布中采样的,那么分析数据的最佳方法是先转换为对数,然后分析对数。不考虑变换就直接进行非参数检验是错误的。
•根据数据的分布情况,其他变换也可能有用(倒数)。
•由于异常值的存在,数据可能无法通过正态性检验。移除异常值可以恢复正态性。
•在数据集较小的情况下,决定使用参数检验还是非参数检验最为重要(因为非参数检验的检验力非常低)。但对于小数据集,正态性检验几乎没有检测到非高斯分布的检验力,因此自动方法会给你带来错误的信心。
•对于大数据集,正态性检验可能过于敏感。正态性检验的低 P 值会告诉你,有确凿证据表明数据不是从理想的高斯分布中采样的。但你已经知道这一点,因为几乎没有任何科学相关变量会形成理想的高斯分布。你想知道的是,数据分布与理想高斯分布的偏离程度是否足以使传统统计检验(假设为高斯分布)失效。正态性检验并不能回答这个问题。在数据集较大的情况下,微不足道的偏离会导致较小的 P 值。
何时使用参数检验,何时使用非参数检验,是一个需要思考和透视的难题。这一决定不应自动做出。