我们在用IBM SPSS进行数据分析的时候,经常会遇见这样一种情形,想把不符合自己分析要求的数据全部筛掉。我们把这些要筛掉的数据叫作无效数据,无效数据不筛选掉不但会降低分析的效率,而且会影响最终结果的准确性。
要想提高准确性就要从低价值密度的数据中筛去我们用不到的数据,留下我们需要的数据,然后在此基础上进行数学加工,最终得出想要的结果。在此过程中我们不可能一条一条地将数据筛掉,这样做时间和精力都不允许,就算完成了准确率也无法得到保障。
我们可以把各种数据源导入IBM SPSS,然后在其中完成数据筛选,接着做分析,最终得出结果。我将在下文用几个简单的步骤来教大家用IBM SPSS完成数据筛选。
1、导入数据
SPSS可以支持各种数据源,我们常用的Excel、txt等都可以作为数据源导入。如果想要了解更多的数据源导入方式,可以自行去IBM SPSS官网查看相关的文档。
我们先在菜单栏中点击“打开”按钮,在下一级菜单中点击“数据”按钮。
图1:按钮在菜单栏中的位置
接着会出现打开数据界面,我们需要将文件类型选择为Excel,然后再选择所需要的文件点击打开。我用的是Excel作为数据源,大家可以根据自己的情况来选择。
图2:打开数据界面
点击打开过后根据软件给出的提示,直接可以将数据导入到SPSS中。
图3:数据界面展示
2、对数据进行筛选
在菜单栏中点击“数据”按钮,再点击下级菜单的“选择个案”按钮。
图4:筛选菜单选择界面
3、选择要进行筛选的变量
首先我们要选择按什么变量进行筛选,选择的变量将成为筛选的约束条件。比如图中选择的是年龄,那就以年龄大于27作为约束条件。第一步我们选择一个变量作为约束条件,第二步点击“如果条件满足”按钮,第三步点击下方“如果”按钮。
图5:选择个案界面
4、编辑具体的约束关系
进入到具体约束关系编辑界面后,需要给出约束关系式。第一步我们把相应的变量(图中是年龄)加入到右侧的关系栏中,然后用下方的数学符号编辑关系式,图中我选择的关系式为>27,大家可以自行编辑。
图6:约束关系编辑界面
5、最终结果展示界面
如图所示打上“斜杠”的数据会被冻结,被冻结并不意味着被删除,只是在接下来的分析中并不会被加入分析。需要注意筛选数据并不是把数据删除,因为这些被筛选的数据在本次分析中不会被用到,并不代表在下次分析中不会被用到。所以我们只是将它冻结,并没有删除。
图7:最终结果展示界面
筛选数据是数据分析中较为常见的问题,需要注意只有在数据彻底没用的时候才可以删除,否则我们需要把数据冻结来完成筛选。