在统计学中,随机抽样是非常重要的一种统计分析手段,它使得研究对象有相同的机会被分在某一处理组当中,排除人为因素的影响和干扰。随机抽样是提高研究样本代表性和组间均衡性的重要方法,它的正确使用将直接影响到研究成果的可靠性。
下面我就以一篇简单的教程文章,为大家介绍使用IBM SPSS Statistic,进行随机抽样。
一、设定随机种子
首先我们需要准备好一组数据,接下来的随机抽样将在这组数据中进行随机抽取。准备好数据后,我们点击转换菜单的“随机数生成器”,打开SPSS的随机抽取器。
图1:随机数生成器
在活动生成器初始化选项中,勾选“设置起点”,然后选择其中的“固定值”,默认的固定值是2000000,我们采用默认即可。这里选择固定值而不是随机,是为了保证每一次随机抽样的抽取值都是相同的,保证抽样结果具有可重现性。
图2:设置固定值
二、简单随机抽样
点击“数据”菜单,选择其中的“选择个案”选项,进入选择个案界面。在该界面中,我们勾选“随机个案样本”,随后在“输出”项中,选择“将选定个案”复制到新数据集,生成一个随机抽取出来的全新数据集合,操作步骤如图3。
图3:设置随机个案
点击“样本”按钮,设置样本大小的具体参数,主要有两种设置方法,一种是近似法,我们可以设置按百分比大小来选择样本大小,如百分之十,那么会从1000个数据中抽取出100个随机样本。
图4:百分比设置样本大小
另外一种是精确法,我们可以设置从前1000个样本中,精确抽取出99个随机样本,如图5。
图5:精确设置样本大小
完成以后,回到上个页面点击“确定”,SPSS就会帮我们快速生成一个全新的数据集,当中的数据就是从原本样本中随机抽取出来的数据。
图6:随机抽取结果
这就是关于IBM SPSS Statistic软件,进行随机样本抽取并生成新数据集的完整过程,除了这种简便的随机抽样方法外,对于一些更复杂的随机抽样要求,我们还可以通过外部脚本等多种方式在SPSS中进行随机抽样