卡方检验是一种常用的非参数检验方法,其统计的是样本的实际观测值与理论推断值之间的偏离程度,卡方值越大,二者偏差程度越大;反之,二者偏差程度越小,可用于检验数值是否符合分布规律、检验因素的影响是否有差异等。
IBM SPSS Statistics非参数检验中的卡方检验,比较的是变量中的实际观测频率和期望的频率的差异。本文将以检验数值是否符合均匀分布为例,演示IBM SPSS Statistics卡方检验方法的使用。
一、打开数据文件
如图1所示,打开一组掷骰子的数据,其中包含了掷骰子次数、点数两个变量。掷骰子的结果数据是一个典型的均匀分布数据,骰子出现1-6点数的概率是相等的。
图1:掷骰子数据
二、应用卡方检验
接着,如图2所示,打开IBM SPSS Statistics的分析菜单,并选择其非参数检验中的“卡方检验”。
图2:非参数检验之卡方检验
如图3所示,设置面板中包含了检验变量列表、期望范围、期望值等选项。接下来,使用示例数据演示卡方检验的操作。
图3:卡方检验设置面板
1、选择变量
我们先简单了解一下卡方检验中的选项含义:
1. 检验变量列表,即用于检验的变量。
2. 期望范围,用于设置卡方检验的数据范围,默认选择“从数据中获取”,即使用数据中的最大值和最小值作为期望范围;如需“使用指定范围”,需手动设置范围。
3. 期望值,用于设置数据中各分类所占的比例,默认选择“所有类别相等”,即检验数据是否服从均匀分布;选择“值”,则检验数据是否服从设定的分布规律,需输入指定分组的值。
本例中,我们需要检验的是掷骰子的结果是否服从均匀分布,因此,需将“点数”添加为检验变量列表,并设置“从数据中获取”的期望范围,以及“所有类别相等”的期望值。
图4:变量设置
2、设置精确检验
由于卡方检验属于非参数检验,需要进行精确检验设置。一般情况下,选择“仅渐进法(适用于较大样本或服从渐进分布的数据)”,如果数据不符合渐进分布,则要选择蒙特卡洛法。
图5:设置精确检验
3、设置选项
接着,进行选项设置,如图6所示,选取描述统计,获取数据的频率分析数值,帮助解读数据结果。
图6:设置选项
4、分析结果解读
完成以上设置后,运行卡方检验。
首先,如图7所示,从频率表可以看到,各个点数的出现概率几乎相同,其期望个案值为16.7。
接着,分析检验统计数据,其渐近显著性为1,表明检验结果不显著,不能拒绝假设。由于本例检验所用的原假设是数据的分布与均匀分布无差异,检验结果不显著,无法拒绝原假设,也就是数据服从均匀分布。
图7:结果不显著
综上所述,通过运用IBM SPSS Statistics的卡方检验,并设定的所有类别相等的期望,可检验数据是否服从均匀分布。
另外,卡方检验除了可用于检验均匀分布外,还可以通过设定交叉表进行列联表分析,来探索变量间的相关关系。