独立样本T检验与平均值检验、单样本T检验、配对样本T检验均属于比较平均值的检验方法。不同的是,独立样本T检验比较的是两组个案的平均值。该检验需要符合随机分布的假定,也就是说,两组个案数据间的差异无其他人为的影响因素。
需要注意的是,“独立样本T检验”检验的是两组个案,而不是两个变量,因此需要构建个案组数据;另外,其分组变量需用数值标识。这两点在IBM SPSS Statistics软件操作中需格外注意。
一、打开数据文件
本例子检验的是饮用牛奶A组与饮用牛奶B组的初中生身高平均值是否有显著性差异。
如图1所示,示例数据展现的是饮用牛奶A与饮用牛奶B两个个案组的身高数据,如您使用的数据是两个变量的变量组数据(即包含饮用牛奶A与饮用牛奶B两个变量的数据),需通过将变量数据转换为个案数据后才能进行后续操作。
但另一方面,示例数据中的饮用牛奶类型变量使用的是字符串值,我们需要先将字符串转换为数值,才能进行独立样本T检验。
图1:示例数据
二、为饮用牛奶类型变量重新编码
如图2所示,打开IBM SPSS Statistics转换菜单中的“重新编码为不同变量”。
图2:重新编码为不同变量
然后,如图3所示,将需要重新编码的“饮用牛奶类型”变量添加到右侧输出变量方框中,并在名称输入框中为其命名为“饮用牛奶类型编码”。
接着,单击“旧值和新值”按钮,匹配旧值与新值。
图3:设置输出变量
如图4所示,在旧值与新值匹配面板中,分别将饮用牛奶A、饮用牛奶B与数值1、2相匹配。
图4:匹配旧值与新值
完成变量的重新编码后,返回数据集,如图5所示,数据中出现了新的变量—饮用牛奶类型编码。
图5:完成变量的重新编码
为了让重新编码后的变量值含义更加明确,如图6所示,我们可以打开变量视图,编辑变量的值标签。
图6:编辑变量的值标签
如图7所示,在值标签设置面板,分别将值1、2标签为饮用牛奶A、饮用牛奶B。
图7:设定标签
如图8所示,返回变量视图,可以看到,值标签已经编辑完成。
图8:完成标签设定
三、应用独立样本检验
完成数据的处理后,就可以打开IBM SPSS Statistics的独立样本T检验功能(分析-比较平均值-独立样本T检验),正式开启数据的检验。
图9:独立样本检验功能
上一节,我们重点讲解了IBM SPSS Statistics独立样本T检验的检验原理、数据要求以及数据转换的方法。这部分的内容相当重要,建议先理解了上一节内容再学习本节的实例操作。
如图1所示,可以看到,独立样本T检验仅包含了检验变量,因此,需要使用个案组数据进行检验,而其分组变量是作为标识两组个案使用的。接下来,我们通过示例数据学习下操作。
图1:独立样本T检验
一、选择变量
首先,了解下设置面板中的变量概念:
1. 检验变量,即检验均值是否存在显著性差异的变量数值。
2. 分组变量,即用于标识两组个案的变量。
本例中,我们需要检验的是饮用牛奶A组与饮用牛奶B组的平均身高数据是否有差异。因此,需要将身高变量添加为检验变量,将饮用牛奶类型编码添加为分组变量。
然后,单击定义组按钮。
图2:选择变量
二、定义组
如图3所示,在定义组设置面板,需要设置个案组对应的编码数值,必须是数值型值。上一节中,我们已经将饮用牛奶类型变量重新编码为值1、2,因此,可以直接将其与组1、2匹配。
图3:定义组
三、选项设置
接着,打开“选项”按钮,设置检验分析的置信区间,一般情况下,设置为95%能确保较大的准确性。同时,设置“按具体分析排除个案”的缺失值处理方式。
图4:选项设置
四、分析结果解读
完成以上设置后,运行分析,如图5所示,数据中分别包含63个饮用牛奶A与63个饮用牛奶B的身高数据,从其平均值看到,饮用牛奶A组的身高均值高于饮用牛奶B组的身高均值,但其差异是否显著还要看显著性数据。
图5:描述统计数值
如图6所示,从独立样本检验图表的数据看到,显著性(双尾)的数值0.711大于0.05(95%置信区间下),不能拒绝原假设,也就是说,饮用牛奶A组的身高均值与饮用牛奶B组的身高均值无显著性差异。
图6:结果不显著
以上就是IBM SPSS Statistics独立样本T检验的应用介绍。该功能用于比较两组个案的均值差异,可用于验证两个对比个案组的均值数值是否有显著性差异,比如用于药物研究领域,验证两种药物有效性是否有差异等。