网站首页/硬件软件列表/内容

SPSS多元logistic回归区分的使用技巧

硬件软件2024-05-04阅读
SPSS由IBM公司出品,它提供了包括描述性统计、推断性统计、因子分析、聚类分析、回归分析等多种统计分析功能,并包括文本分析、机器学习算法、数据分析模型等。SPSS的界面友好,易于操作,能够快速从数据中提取有用的洞察和分析,广泛应用于教育、心理、医学、市场、人口、保险等多个研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。

回归分析是数据处理中较为常用的一类方法,它可以找出数据变量之间的未知关系,得到较为符合变量关系的数学表达式,以帮助用户完成数据分析。

接下来我们要介绍的就是回归分析中的多元回归分析方法,IBM SPSS Statistics为用户提供了成熟的多元logistic回归分析算法。

一、概述

1.数据

数据样本

图1:数据样本

这是一份对不同人群早餐选择的调查数据,通过SPSS的多元回归分析,可以将人群特征变量对早餐类型进行分析,找到它们之间的关系。

2.功能位置

功能位置

图2:功能位置

在“分析”菜单下,我们可以找到“回归”中的“多元logistic”分析,进入多元回归分析的窗口。

二、分析方法

1.因变量设置

因变量设置

图3:因变量设置

因变量就是跟随自变量变化的量,本例中指的是“首选的早餐”这一变量。

点击“参考类别”,设置因变量的参考类别,这是分析时的参考样,我们设置为所有类别都和最后一个类别对比,类别顺序选择升序。

2.因子和协变量

因子和协变量

图4:因子和协变量

因子可以简单理解为自变量,我们这里将年龄分段、婚姻状况和生活方式作为因变量处理。

协变量是分析过程中需要控制的、对因变量有一定影响的控制变量,这里设置为性别。

3.分析模型

分析模型

图5:分析模型

SPSS的多元回归分析有三类模型可选,主效应是指设置好的因子和协变量与因变量之间的关系分析;全因子模型既包括主效应,也包括因子和协变量之间的交互分析;定制步进式则可以有用户自己定义分析类型。

我们这里选择主效应进行分析即可。

4.统计设置

统计设置

图6:统计设置

这个窗口内设置的是需要进行的统计数据分析,包括多类统计数据可选,我们勾选模型下的伪R方、单元格可能性、步骤摘要、分类表、模型拟合度信息和拟合度,参数下的估计(置信区间设置为95%)和似然比检验。

定义子群体选择“由因子和协变量定义的协变量模式”。

5.收敛条件

收敛设置

图7:收敛设置

在条件对话框中,进行收敛设置。

最大迭代数是数据进行回归分析时可进行迭代的次数,这个数值必须是大于或小于100的整数,最大步骤对分设置的是迭代时的等分数,系统默认是5。

对数似然收敛可设置收敛值,回归过程中对数似然比函数是大于设定值的;参数收敛的数值设置类似。

本例中该对话框保持默认即可。

6.选项设置

选项设置

图8:选项设置

在选项对话框中设置离散度量为“无”。

数据的进入概率为0.05,出去概率为0.1,这两个参数中,前者越大,进入模型的数据越多;后者越小,数据被剔除的越多,进入和出去方法均选择似然性。

其余保持默认即可。

7.保存设置

保存设置

图9:保存设置

在这个对话框中设置需要保存的变量,如果需要将模型信息输出到XML文件,也可以在次设置。

8.完成分析

结果输出

图10:结果输出

完成上述设置后,就可以在日志输出窗口中查看分析结果啦!分析结果包含多个表格,每个数值都有特定含义,大家在分析的时候也要认真观察数据哦!

三、小结

多元logistic回归分析实质上是二元logistic回归分析的加和,在操作方法和结果分析上都有一定的相似之处,如果大家认为多元回归分析理解起来有困难,可以先学习一下IBM SPSS Statistics二元回归分析的操作和分析。


世界上许多有影响的报刊杂志就SPSS给予了高度的评价。
相关阅读