当前位置:文档之家› 多元统计分析实验报告

多元统计分析实验报告

实验一一、实验目的及要求对应分析是你也降维的思想以达到减化数据结构的目的,凤的研究广泛用于定义属性变量构成的列联表利用对应分析方法分析问卷中教育程度与网上购物支付方式之间的相互关系。

二、实验环境SPSS 19.0 window 7系统三、实验内容及实验步骤(实践内容、设计思想与实现步骤)实验题目:通过分析问卷数据,绘制如下的教育程度与网上购物支付方式的交叉表,运用对应分析方法研究教育程度与网上购物所选择的支付方式之间的相关性,及揭示不同人群网上购物的特征等问题。

设计思想:原假设:H1:χ2>χα2[(n−1)(p−1)]实现步骤:1.在变量视窗中录入3个变量,用edu表示【教育程度】,用fangshi表示【在网上购物时采用什么样的支付方式】,用pinshu表示【频数】;如图所示:2.先对数据进行预处理。

执行【数据】→【加权个案】命令,弹出【加权个案】对话框。

选中【加权个案】按钮,把【频数】放入【频率变量】框中,点击【确定】按钮完成。

3.打开主窗口,选择菜单栏中的【分析】→【降维】→【对应分析】命令,弹出【对应分析】对话框。

4.将【教育程度】导入【行】,将【在网上购物时采用什么样的支付方式】导入【列】。

5. 单击【定义范围(D)】,打开【对应分析:定义行范围】对话框;定义行变量分类全距最小值为1,最大值为4,单击【更新】;点击【继续】,返回【对应分析】对话框;同方法打开【对应分析:定义列范围】对话框;定义列变量全距最小值为1,最大值为5,单击【更新】;6. 单击【统计量】打开【对应分析:统计量】对话框;选择【行轮廓表】,【列轮廓表】;单击【继续】,返回【对应分析】对话框,7.选择【绘制】→【对应分析:图】对话框,选择【散点图】中的【行点】、【列点】选择【线图】中的【已转换的行类别】、【已转换的列类别】,单击【继续】,返回【对应分析】对话框。

8.单击【确定】按钮,完成设置并执行列联表分析。

四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。

记录实验的结果)SPSS实验结果及分析:上表显示了在32155名被调查者中,大多数消费者在网上购物时选择第三方支付和网上银行支付,在网上购物的消费人群以大学本科生相对最多。

“行简要表”是用对应表中相应位置的数据除以每一行的有效边际,显示了各频数在各行方向上的百分比。

由表可以看到,消费者在网上购物时选择“第三方支付”所占的比例最高,为36.3% ,使用除问卷设计以外付款方式的较少,为0.9%。

表中最后一行的“质量”值即为p j。

“列简要表”是用对应表中相应位置的数据除以每一列的有效边际,显示了各频数在各列方向上的百分比。

由表可以看到,选择网上购物的消费者中“高中-中专及以下”人群所占的比例最高,为30.6% ,表中最后一列的“质量”值即为p i 。

摘要表给出了总惯量、χ2值及每一维度(公共因子)所解释的总惯量的百分比信息。

由表可知总惯量为0.008,χ2=250.999,有关系式:250.999= 0.008×32155,可以清楚地看出总惯量与χ2值之间的关系,同时说明总惯量描述了列联表行与列之间总的相关关系。

且由表可看到p=0.0000<0.05,因此拒绝原假设,认为行变量和列变量有显著的相关性。

该表显示了行变量各分类降维的情况,其中:表中第三、第四列是行变量各类别在第1、第2个因子上的因子载荷,它们将成为分布图中的数据点的坐标;第六、七列是行变量各分类对第1、2个因子值差异的影响程度;第八、九列是第1、第2因子对行变量各分类差异的解释程度。

“教育程度的行点”是教育程度在第1、第2因子上载荷的散点图,借助该图可分析教育水平各类间的差异性;可以看出,这些类别可以分别自成一类;“行和列点图”是教育程度和网购支付方式的对应分布图,借助该图可分析不同教育程度人群选择网购支付方式之间的倾向性。

五、教师评价实验二一、实验目的及要求在市场调查问卷中,总会设计一部分多项选择题,而对于多选题也是问卷分析的关键一步,通过分析问卷中的多选题并绘制交叉分析发现社会生活中许多问题间的关系。

二、实验环境SPSS 19.0 window 7系统三、实验内容及实验步骤(实践内容、设计思想与实现步骤)实验题目:通过SPSS软件分析多选题“请问您目前所拥有的数码产品有哪些?”设计思想在统计分析中一般采用频数分析,SPSS提供了专门的多选题频数分析统计分析功能,即通过多重响应分析。

实现步骤:1.建立多重响应项集:选择菜单栏中的【分析】→【多重响应】→定义变量集。

【将变量编码为】中选择【二分法】计数值为1,在【定义多重响应集:名称】中定义A,单击【添加】最后单击【关闭】,如图所示:2.多重响应项集的频数分析:选择菜单栏中的【分析】→【多重响应】→【频率】,在【多响应频率】对话框中将A移入【表格】单击确定,绘制相应的对应频率表。

3.多重响应项集的交叉表分析:选择菜单栏中的【分析】→【多重响应】→【交叉表】,将【多响应集】中的A移入【行】,“教育程度”移入【列】,【定义范围(G)】中填入最小值1,最大值4,单击【确定】完成。

四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。

记录实验的结果)SPSS实验结果及分析:上表主要显示样本是否有系统缺失,此表可知,共有6个缺失值,有效率接近100%。

表中给出了个案的响应率和普及率,响应率18.1%=17615/97355,即目前已经拥有数码产品为笔记本的人员在所有响应中(所有1的次数)的比例;而普及率70.7%=17615/249,在有效样本中的比例。

我们选择用柱形图表达数据效果:上表是教育程度与目前已经拥有的数码产品之间的交叉表,由表可以看出大学本科生所拥有的数码产品数及种类在被调查者中居多,这与我国目前国民教育程度的事实基本吻合。

表中还显示了全国数码产品的实用情况,目前笔记本电脑和台式电脑使用者较多,国家信息化科技化程度较高。

五、教师评价实验三一、实验目的及要求通过运用主成分分析降维的思想,研究如何通过原始变量的少数几个线性组合来解释原始变量的绝大部分信息,即在损失较少信息的情况下,研究我校大学生消费水平的影响因素。

二、实验环境SPSS 19.0 window 7系统三、实验内容及实验步骤(实践内容、设计思想与实现步骤)实验题目:调查我校大学生消费情况问卷中,设计对学生的消费水平的影响因素有每月伙食费、通讯费、娱乐费、学习费、购买服饰及配饰费和网购费,通过主成分分析方法处理该数据,以期望用少数变量描述我校大学生消费水平的影响因素。

实现步骤:1.选择菜单栏中的【分析】→【描述统计】→【描述性】命令,弹出【描述性】对话框。

将需要分析的变量选入【变量】对话框,选择【将标准化得分零存为变量(Z)】。

2.选择菜单栏中的【分析】→【降维】→【因子分析】命令,弹出【因子分析】对话框,将要分析的变量选入了【变量】对话框。

3.单击【描述】按钮,选择【【原始分析结果】和【KMO和Bartlelt的球形度检验】,单击【继续】。

4.单击【抽取】按钮,选择【未旋转的因子解】和【碎石图】,单击【继续】。

5.单击【确定】按钮,完成设置并执行列联表分析。

四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。

记录实验的结果)SPSS实验结果及分析:表给出了每个原始变量中提取的信息,给出了采用主成分方法提取因子后各变量的共同度,包括各变量对应的初始共同度和抽取因子以后的再生共同度。

表的第一行为相关系数矩阵,第二部分是假设相关系数为零的单侧显著性检验概率矩阵。

由表可以看出,每学习费与通讯费、学习费与购买服饰配饰之间有相关关系。

上表显示了各主成分解释原始变量总方差的情况,SPSS默认保留特征根大于1的主成分,但由于特征根大于1提取信息较少所以本题选择保留特征根大于0.5的主成分。

本题中保留了5个主成分,这5个主成分集中了原始6个变量信息的93.749%,可见效果比较好。

2.4492.449+1.029+0.912+0.667+0.569+0.375等于特征值的和p=4。

表给出了标准化原始变量用求得的主成分线性表示的近似表达式:y1=(0.352x1+0.678x2+0.751x3+0.231x4+0.765x5+0.814x6)/√δii y2=(0.618x1−0.006x2+0.024x3+0.719x4−0.278x5−0.227x6)/√δii y3=(−0.64x1−0.198x2−0.017x3+0.650x4+0.157x5+0.126x6)/√δii y4=(0276x1−0.659x2−0.073x3−0.049x4+0.330x5+0.201x6)/√δii y5=(0.090x1+0.255x2−0.651x3+0.071x4+0.232x5+0.112x6)/√δii表中的第i列的每个元素分别除以第i个特征根的平方根√δi,就可以得到主成分分析的第i个主成分的系数。

由于主成分分析特征值唯一但是特征向量不唯一,所以主成分结果不唯一。

上述碎石图是根据因子序号和对应特征值描绘得到的,根据点间连线坡度的陡缓程度,可以比较清晰的看出因子的重要程度。

比较陡的直线说明断点对应因子的特征值差值较大,比较缓的置信则对应较小的特征值差值。

五、教师评价实验四一、实验目的及要求结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。

下面以一个研究实例作为说明,使用Amos7软件进行计算,阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。

二、实验环境SPSS 19.0 Amos window 7系统三、实验内容及实验步骤(实践内容、设计思想与实现步骤)实验题目:预了解我校大学生的消费状况,我班同学充分利用所学知识设计、发放、录入问卷,现从所收集的数据中,选择部分有关变量,从个人信息和消费水平方面了解我校学生消费行为。

设计思想:1.潜变量和可测变量的设定,结果如下:3.可测变量的标准化处理4.结果方程模型的初步建立实现步骤1.通过对潜变量和可测变量的分析,在SPSS中对收据数据中的可测标量可信度检验。

选择菜单栏中的【分析】→【度量】→【可靠性分析】,将需要分析的可测变量添加到【显目】对话框中,单击【确定】完成。

2.将可测变量进行标准化处理。

选择菜单栏中的【分析】→【描述统计】→【描述性】命令,弹出【描述性】对话框。

将需要分析的变量选入【变量】对话框,选择【将标准化得分零存为变量(Z)】。

3.保存SPSS分析数据,在Amos中建立基本模型,如下:添加可测变量并进行分析。

四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。

记录实验的结果)SPSS实验结果及分析:可信度结果分析如下,由结果可知,所选择的14个可测变量的可信度为40.7%。

相关主题