在使用IBM SPSS Statistics参数检验中的T检验时,一般情况下,都需先验证数据是否服从正态分布。如果服从正态分布的话,就可以执行T检验;反之,则需要使用非参数检验的方法。
那么,该如何使用SPSS检验数据是否服从正态分布呢?我们可以使用非参数检验中的KS检验、图表中的Q-Q图、描述统计中的偏度峰度系数、探索统计的正态验证来进行数据的正态分布检验。本文会先重点介绍KS检验与Q-Q图。
一、KS检验
KS检验,是Kolmogorov-Smirnov检验的简称,中文译为柯尔莫哥洛夫-斯米尔诺夫检验,是一种检验拟合优度的检验方法,可用于检验数据是否服从理论分布,比如是否服从正态分布。
接下来,我们使用一组初中生的身高数据来作为示例数据。
图1:示例数据
然后,如图2所示,在SPSS的非参数检验菜单中,打开单样本KS检验功能。
图2:KS检验功能
如图3所示,在KS检验设置面板中,重点是要进行检验变量与检验分布的设置。本例需要检验的是身高样本数据是否服从正态分布,因此,需要将身高变量添加到检验变量,并勾选检验分布中的“正态”选项。
在正态检验选项中,一般情况下,选择默认的“使用样本数据”即可。
图3:KS检验设置
然后,再打开选项面板,勾选所需的统计数值(建议勾选描述)与缺失值的处理方式。
图4:选项设置
完成检验设置后,运行检验。
如图5所示,在KS检验结果中,可以看到,当前检验的分布是正态分布,而其渐进显著性数值为0.00<0.05,因此拒绝原假设,也就是说,示例身高样本数据不符合正态分布。
图5:KS检验结果
二、Q-Q图
Q-Q图,是Quantile-Quantile图的简称,通过计算两个数据的分位数来绘制散点图,从而检验数据是否服从理论分布。
正态Q-Q图,即实测值与预期的正态值组成的散点图。如果数据服从正态分布的话,数值在Q-Q图的分布会呈现直线型;反之则不服从正态分布。
Q-Q图属于SPSS描述统计中的一种,如图6所示,依次单击分析-描述统计-Q-Q图。
图6:Q-Q图功能
如图7所示,基于本文的数据验证目的—验证身高样本数据是否服从正态分布,需将身高变量添加到变量选项,并在检验分布中选取“正态”选项。其他选项,一般情况下,保持默认即可。
图7:Q-Q图设置
完成以上设置后,运行检验。
从图8的身高正态Q-Q图看到,散点图上的数值似乎接近与直线很接近。但由于身高的差别数值较小,我们还需要具体看看数值与直线的偏离大小。
图8:身高正态Q-Q图
从图8的去趋势正态Q-Q图看到,实际上,实测值与正态的偏差还是比较大的,因此,不能确切说明身高样本数据服从正态分布。
图9:去趋势正态Q-Q图
三、小结
综上所示,通过正态Q-Q图,我们可以直观地观察到数据的正态分布情况,但当数值与直线有一定偏离的情况下,还需要借助去趋势正态Q-Q图,以及KS检验来进一步检验数据的正态性。