网站首页/硬件软件列表/内容

SPSS缺失值补充完成图文解析图文详细教程

硬件软件2024-05-04阅读
SPSS由IBM公司出品,它提供了包括描述性统计、推断性统计、因子分析、聚类分析、回归分析等多种统计分析功能,并包括文本分析、机器学习算法、数据分析模型等。SPSS的界面友好,易于操作,能够快速从数据中提取有用的洞察和分析,广泛应用于教育、心理、医学、市场、人口、保险等多个研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。

在很多时候将数据库导入SPSS时,里面有一两项数据是缺失的,但我们又需要全部的数据进行分析。这时候再回头找数据源,已经是不现实的了。为了保证数据分析的正常进行,我们可以在SPSS中用自带的功能进行SPSS缺失值补充。

IBM SPSS中有好几种不同的数学公式可以进行缺失值补充,而且可以一次补充多个缺失值。下文我将以一份银行的数据库,用几个步骤来展示这个功能。

1、数据库中缺失值展示

下图是模拟各银行存贷比的数据(图中均为公开数据,仅供本次案例演示),可以看到在北京银行的最后一栏存贷比中有一项数据是缺失的,接下来我们将数据导入IBM SPSS Statistics来进行缺失值补充。

缺失值展示

图1:缺失值展示

2、数据导入SPSS

在SPSS的数据界面,点击‘文件’按钮再点击‘打开’按钮,最后点击‘数据’按钮进入到数据打开界面。

进入打开数据界面按钮展示

图2:进入打开数据界面按钮展示

进入打开数据界面之后,第一步点击‘下拉’按钮,第二步选择自己的数据库类型(图中选择的是Excel),第三步选择文件名,第四步点击‘打开’按钮。

打开数据步骤展示

图3:打开数据步骤展示

最终打开后的数据如图4所示。

打开后的数据展示

图4:打开后的数据展示

3、缺失值补充

点击上方菜单栏的‘转换’按钮,再点击下级菜单的‘替换缺失值’。

替换缺失值按钮展示

图5:替换缺失值按钮展示

进入替换缺失值界面后,我们先选中有缺失值的那一栏变量加入到新变量框中。如果有多栏变量有缺失值,我们可以选中多栏变量一起加入新变量框。

缺失变量选择

图6:缺失变量选择

变量加入之后,我们选择补充缺失值的方法,可以看到有五种数学方法。这里展开说明一下,序列平均值和临近点的平均值还有中间值都类似于数学上的平均值,线性插值和邻近点线性趋势则是将数据进行函数作图,然后用缺失点的函数值进行补充。

缺失值补充方法展示

图7:缺失值补充方法展示

4、最后结果展示

可以看到在缺失值的右侧生成了一个完全相同的变量栏,并且将缺失的数据补充完整了。

结果展示

图8:结果展示

数据分析中缺失值的出现是不可避免的,比如一些问卷调查中有些人漏填某一项。再去找到具体的人重新填写也不现实,通过SPSS软件中的缺失值补充这个功能就可以很好的解决这个问题。


世界上许多有影响的报刊杂志就SPSS给予了高度的评价。
相关阅读