神经网络是基于模仿生物大脑结构及功能的信息处理系统,可通过各种算法从数据中学习如何完成任务,在模式识别、人工智能、预测、医学等领域拥有广阔的发展前景。
在本文中,会通过神经网络中的经典例子鸢尾花,讲解如何利用IBM SPSS Statistics实现神经网络的数据处理和模型训练,从而得到相应的神经网络模型。
在实际场景中应用神经网络方法时,通常需要对数据进行标准化处理,以此消除数据之间的量纲差异,让后续的数据使用更加方便。
本文使用的是一组包含三种类型的鸢尾花数据,拥有四个指标,目的是通过四个指标对鸢尾花的类型进行预测。
图1:示例数据
首先,如图2所示,在分析菜单中打开描述功能。
图2:描述功能
如图3所示,选中“将标准化值另存为变量”,点击确定。
图3:标准化值另存为变量
最终得到标准化的数据,如图4所示。
图4:标准化数值
首先需要生成一个分组变量,将70%的样本数据用于训练。如图5所示,选择数据菜单中的计算变量功能,设置目标变量“分组”,使用数字表达式对变量分组。
图5:变量分组
如图6,在分析菜单中选中神经网络,打开多层感知器功能。
图6:多层感知器功能
接下来在功能面板中设置各项参数,如图7所示,在变量分区中设置因变量和因子。
图7:设置参数
点击分区,如图8所示,选择已生成的分组变量。
图8:分区变量选择
再点击输出,选择图9中被选中的选项。
图9:输出选项
最后点击保存,如图10所示,选择图中的两个选项,然后点击确定。最终可得到这组数据的神经网络模型及训练结果。
图10:保存