IBM SPSS Statistics的频率分析是描述统计的一种分析方法,可用于描述多种类型变量的统计数值,其中包含了定性与定量变量,同时也提供了多种图形显示,如条形图、直方图等,用于数据的可视化呈现。
接下来,我们会分别使用实例介绍定性变量与定量变量的频率分析。
一、定性变量的频率分析
如图1所示,打开一组数据,该数据包含了账号、性别、地区、来源四个定性变量,以及客单价、点击页面数两个定量变量。
图1:示例数据
接着,单击IBM SPSS Statistics的分析菜单,在其“描述统计”选项中选取“频率”选项。
图2:频率分析功能
如图3所示,在频率分析设置面板中包含了变量选择、统计、图表等功能选项。对于定性变量来说,一般只需将变量(性别、来源变量)添加到右侧,并勾选下方的“显示频率表”,就可以单击“确定”,运行分析。
图3:选择变量
如图4所示,对于性别、来源这些定性变量,我们可以获取到频率计数以及百分比占比的分析结果。
图4:频率表
一、定量变量的频率分析
从以上分析可以看到,定性变量的频率分析是比较简单的。接下来,我们进行比较复杂的定量变量的频率分析。
图5:客单价变量
如图6所示,将客单价添加到右侧方框后,单击“统计”选项。
图6:统计选项
统计面板中包含了多种类型的统计数值,其中的作用如下:
1. 百分位值:一组数据按照从小到大排序,即可计算其相应的累计百分位,以四分位数为例,就是将数据分为四个相等的分组,分别以第 25、50、75百分位数作为四分位数的百分位值。
2. 集中趋势:描述数据分布的集中趋势,包括平均值、中位数、众数和总和。
3. 离散:描述数据分布的离散程度,包括标准差、方差、最小值、最大值等。
4. 分布:偏度用于描述分布形状,峰度用于描述对称性。
依照以上的应用介绍,我们勾选了如图7所示的项目,以获得客单价相关的集中趋势、离散程度的分析。
图7:统计设置面板
如图8所示,从分析结果可以看到,在当前99个有效数值的分析下,客单价的平均值为44.29,最大值达到199,最小值只有1,虽然范围较大,但对平均值影响不大。
图8:频率分析结果
返回到频率分析设置面板,单击“图表”按钮,获取可视化图表。
图9:图表选项
如图10所示,可选取条形图、饼图、直方图三种类型的图表。其使用的技巧如下:
1. 条形图可直观地并排对比不同类别的分布情况,适合用于类别计数或百分比的对比
2. 饼图可直观地展现不同类别的单位占比,适用于比较不同类别的贡献程度
2. 直方图,与条形图相似,但更讲究区间的相同刻度,而且可显示正态曲线。
本例中,我们会更关心不同客单价的分布情况,因此选取“条形图”。
图10:图表选项
如图11所示,从条形图可以看到,客单价4,、34、45、56、67、78这些数值占比会比较大。
图11:客单价分布条形图
以上就是IBM SPSS Statistics频率分析的应用介绍。频率分析中包含了多项基础统计分析数值,可帮助我们快速地获取数据的整体分布、离散程度等,有助于后续选取合适的分析方法。