本文将针对分析过后的数据进行详细解读。在解读过程中,我们需要求得方程式的系数,并判断系数的拟合程度、方程式的统计学意义。
一、使用的数据
本文分析所用的数据是一组包含客流量与销售额的数据,研究的是以客流量为自变量、销售额为因变量的线性关系。
图1:示例数据
二、解读检验结果
1.模型拟合效果
模型摘要中的R方是判定系数,其数值越接近于1,表明方程的拟合优度越好,一般需要大于0.6。
从如图2所示的模型摘看到,求得的一元线性回归方程的R方为0.839,说明本例分析所得的回归方程拟合效果良好。
图2:模型摘要
在判定回归方程拟合优度良好的情况下,查看ANOVA分析中的“回归模型”方差分析。如图3所示,“回归模型”的显著性值为0.00<0.05,说明该“回归模型”具有显著的统计学意义,也就是说,客流量与销售额之间存在着显著的线性回归关系。
图3:ANOVA检验2.构建模型表达式
在判定回归模型具有显著统计学意义的前提下,进一步检验求得的系数是否通过T检验。该T检验的原假设为求得的回归系数不具有统计学意义。
如图4所示,可以看到回归系数(客流量对应的系数)的显著性数值为0.00<0.05,拒绝原假设,也就是说方程的回归系数具有统计学意义,可构建y=12.821x-2644.658的一元线性回归方程。
图4:选择变量
3.残差相关性分析
通过上述的分析,我们已经可以认为构建的一元线性回归方程y=12.821x-2644.658具有统计学意义,但是否可用于预设因变量的值,还需要通过残差相关性分析。如果残差存在自相关的话,模型的预测准确度将会不高。
如图5所示,模型的D-W值(德宾-沃森值)为2.060,查阅德宾-沃森表得到,样本量n=198(采用200样本量D-W值),控制变量数量k=1,其下临界值LD=1.664、上临界值UD=1.684。
根据D-W值的判定规则,本例的D-W值符合“如果UD
图5:D-W检验
另外,再通过残差直方图看到,残差的分布趋近于正态曲线的分布。
图6:残差直方图
再结合正态P-P图分析,可以看到,数值的分布近似于直线,说明残差的正态性良好。
在满足残差无自相关性、服从正态分布的前提下,说明本例构建的一元线性回归方程具有良好的预测性,可通过为自变量代入数值,求得预测的因变量。
图7:残差P-P图
三、小结
综上所述,在使用IBM SPSS Statistics构建一元线性回归方程时,需要通过判定系数R方判断回归方程的拟合优度,并检验回归方程、方程系数的是否具有统计学意义。