网站首页/硬件软件列表/内容

如何使用SPSS检验数据是否服从正态分布—KS检验与Q-Q图

硬件软件2024-05-04阅读
SPSS由IBM公司出品,它提供了包括描述性统计、推断性统计、因子分析、聚类分析、回归分析等多种统计分析功能,并包括文本分析、机器学习算法、数据分析模型等。SPSS的界面友好,易于操作,能够快速从数据中提取有用的洞察和分析,广泛应用于教育、心理、医学、市场、人口、保险等多个研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。

在使用IBM SPSS Statistics参数检验中的T检验时,一般情况下,都需先验证数据是否服从正态分布。如果服从正态分布的话,就可以执行T检验;反之,则需要使用非参数检验的方法。

那么,该如何使用SPSS检验数据是否服从正态分布呢?我们可以使用非参数检验中的KS检验、图表中的Q-Q图、描述统计中的偏度峰度系数、探索统计的正态验证来进行数据的正态分布检验。本文会先重点介绍KS检验与Q-Q图

一、KS检验

KS检验,是Kolmogorov-Smirnov检验的简称,中文译为柯尔莫哥洛夫-斯米尔诺夫检验,是一种检验拟合优度的检验方法,可用于检验数据是否服从理论分布,比如是否服从正态分布。

接下来,我们使用一组初中生的身高数据来作为示例数据。

示例数据

图1:示例数据

然后,如图2所示,在SPSS的非参数检验菜单中,打开单样本KS检验功能。

KS检验功能

图2:KS检验功能

如图3所示,在KS检验设置面板中,重点是要进行检验变量与检验分布的设置。本例需要检验的是身高样本数据是否服从正态分布,因此,需要将身高变量添加到检验变量,并勾选检验分布中的“正态”选项。

在正态检验选项中,一般情况下,选择默认的“使用样本数据”即可。

KS检验设置

图3:KS检验设置

然后,再打开选项面板,勾选所需的统计数值(建议勾选描述)与缺失值的处理方式。

选项设置

图4:选项设置

完成检验设置后,运行检验。

如图5所示,在KS检验结果中,可以看到,当前检验的分布是正态分布,而其渐进显著性数值为0.00<0.05,因此拒绝原假设,也就是说,示例身高样本数据不符合正态分布。

KS检验结果图5:KS检验结果

二、Q-Q图

Q-Q图,是Quantile-Quantile图的简称,通过计算两个数据的分位数来绘制散点图,从而检验数据是否服从理论分布。

正态Q-Q图,即实测值与预期的正态值组成的散点图。如果数据服从正态分布的话,数值在Q-Q图的分布会呈现直线型;反之则不服从正态分布。

Q-Q图属于SPSS描述统计中的一种,如图6所示,依次单击分析-描述统计-Q-Q图。

Q-Q图功能

图6:Q-Q图功能

如图7所示,基于本文的数据验证目的—验证身高样本数据是否服从正态分布,需将身高变量添加到变量选项,并在检验分布中选取“正态”选项。其他选项,一般情况下,保持默认即可。

Q-Q图设置

图7:Q-Q图设置

完成以上设置后,运行检验。

从图8的身高正态Q-Q图看到,散点图上的数值似乎接近与直线很接近。但由于身高的差别数值较小,我们还需要具体看看数值与直线的偏离大小。

身高正态Q-Q图

图8:身高正态Q-Q图

从图8的去趋势正态Q-Q图看到,实际上,实测值与正态的偏差还是比较大的,因此,不能确切说明身高样本数据服从正态分布。

去趋势正态Q-Q图

图9:去趋势正态Q-Q图

三、小结

综上所示,通过正态Q-Q图,我们可以直观地观察到数据的正态分布情况,但当数值与直线有一定偏离的情况下,还需要借助去趋势正态Q-Q图,以及KS检验来进一步检验数据的正态性。


世界上许多有影响的报刊杂志就SPSS给予了高度的评价。
相关阅读