我们通过散点图研究发现,客流量与销售额之间存在着正相关的关系,而客单价与销售额之间似乎不存在相关关系。
为了进一步验证客单价与销售额之间的关系,同时衡量客流量与销售额之间相关关系的程度,本文将会应用IBM SPSS Statistics的两变量相关检验,探究客单价与销售额、客流量与销售额之间的密切程度。
一、使用的数据介绍
如图1所示,本文使用的是一组包含客流量、销售额、客单价的数据。
图1:示例数据
二、应用双变量相关检验
如图2所示,依次单击分析-相关-双变量选项,打开双变量相关分析面板。
图2:双变量相关
1. 选择变量
在双变量相关性设置面板中,首先,将要研究的变量添加到右侧变量方框中。
图3:选择变量
2. 选项设置
然后,单击选项按钮,并在选项面板中勾选“平均值和标准差”的统计项。
图4:选项设置
3. 相关系数与显著性检验设置
接着,再进行相关系数与显著性检验的设置。
如图5所示,如果数据满足正态分布的话,使用皮尔逊检验结果,否则就应该使用肯德尔或斯皮尔曼检验结果。由于我们仍未进行正态性检验,可以先把所有方法都勾选上。
另外,如果事先知道数据的分布,比如正相关、负相关等,选择单尾检验,否则选择双尾检验。
图5:相关系数与显著性检验设置
4. 检验结果解读
完成以上设置后,运行检验。
首先,从描述统计数值中,可以看到各个变量的平均值与标准差。
图6:描述统计
在查看相关性检验时,需根据数据是否服从正态分布来选取不同的检验结果。如图7所示,对数据应用KS检验来检验数据是否服从正态分布,从其渐进显著性数值看到(均大于0.05),结果不显著,也就是说不能拒绝数据服从正态分布的零和假设(因KS检验的零和假设是数据服从正态分布)。
图7:KS检验
基于数据服从正态分布的前提,查看皮尔逊相关性检验结果。如图8所示,客流量与销售额的皮尔逊系数为0.92,标注了两个星,说明客流量与销售额相关性强;而客单价与销售额的皮尔逊系数为0.342,也有较强的相关性。
图8:相关性检验结果
三、小结
综上所述,IBM SPSS Statistics的双变量相关检验,可对两变量间的相关关系进行程度性的测量,以探究两两变量间相关性的强弱。另外,结合使用散点图,可对数据进行快速的相关性预判,辅助说明两变量间的相关性。