当前位置:文档之家› SPSS软件及应用实验报告

SPSS软件及应用实验报告

SPSS软件及应用实验报告关于男性裤子尺寸影响因素的研究本报告主要是通过搜集了影响男性裤子尺寸的9个因素,分别是腰围、腹围、直档1、直档2、全浪、大腿根围、膝盖围、臀围、裤长,一共测量了250组数据。

旨在通过因子分析,利用降维思想,把多指标转化为少数几个综合指标,并分析得到的主因子的含义。

本报告主要研究的问题如下:(1)对数据进行描述性统计,并按照尺寸换算将厘米换算成尺寸,对数据按照腰围这一指标进行分组,编制频数分布表,并绘制频数分布的直方图;(2)使用单样本K-S检验对腰围换算成尺寸后的数据进行非参数检验,验证是否服从正态分布;(3)对数据进行因子分析,并对因子的含义进行分析。

问题1:根据腰围对所有的样本进行分组,分组结果见附录。

所搜集的腰围数据范围是[62.5,107],根据一尺约为33.3厘米,换算成尺寸范围是一尺九——三尺二,不足的四舍五入。

得到结果如下:尺寸频率百分比有效百分比累积百分比有效 1.9 2 .8 .8 .82.0 13 5.2 5.2 6.02.1 27 10.8 10.8 16.82.2 43 17.2 17.2 34.02.3 52 20.8 20.8 54.82.4 34 13.6 13.6 68.42.5 26 10.4 10.4 78.82.6 27 10.8 10.8 89.62.7 6 2.4 2.4 92.02.8 7 2.8 2.8 94.82.9 10 4.0 4.0 98.83.0 1 .4 .4 99.23.1 1 .4 .4 99.63.2 1 .4 .4 100.0总计250 100.0 100.0表1 尺寸频数分布表图1 频数分布直方图从表1可以看出有82.8%的男性腰围在二尺一和二尺六之间,从表2发现所调查的男性腰围均值为2.37,标准差为0.237,并且近似服从正态分布。

问题2:对腰围换算成尺寸后的数据进行使用单样本K-S检验时,选择方法是正态分布,检验结果如下:单样本 Kolmogorov-Smirnov 检验尺寸数字250正态参数a,b平均值 2.366标准偏差.2368最极端差分绝对.158正.158负-.073检验统计.158渐近显著性(双尾).000ca. 检验分布是正态分布。

b. 根据数据计算。

c. Lilliefors 显著性校正。

表2 单样本Kolmogorov-Smirnov 检验描述统计数字平均值标准偏差最小值最大值(X)尺寸250 2.366 .2368 1.9 3.2表3 腰围的简单描述统计表2给出了单样本Kolmogorov-Smirnov检验的相关统计量。

从表中可以看出单样本K-S检验z统计量值为0.158,渐进显著性水平为0小于0.05,应该是拒绝原假设,认为男性腰围不服从正态分布。

虽然250个样本可以认为是大样本数据,但是就全国人数来说还是太少了。

该数据是来自2015年燕山大学的部分男生,所以出现这样的结果很可能是样本数据太少。

不过也有可能是男性腰围确实不服从正态分布,因为现在还没人针对这一课题进行研究。

问题3:将数据导入SPSS,在菜单栏中依次单击“分析”—>“降维”—>“因子分析”,得到结果如下:KMO 和巴特利特检验KMO 取样适切性量数。

.850Bartlett 的球形度检验上次读取的卡方1643.806自由度36显著性.000表4 KMO 和巴特利特检验上表给出了KMO 和巴特利特检验的结果,其中KMO的值越接近1表示越适合做因子分析,从该表可以得到KMO的值为0.850,表示适合做因子分析。

Bartlett 的球形度检验的原假设为相关系数矩阵为单位阵,显著性p值为0.000小于显著性水平0.05,因此拒绝原假设,即变量之间存在相关关系,适合做因子分析。

公因子方差初始值提取腰围 1.000 .889腹围 1.000 .813直裆1 1.000 .717直裆2 1.000 .733全浪 1.000 .509大腿根围 1.000 .828膝盖围 1.000 .725臀围 1.000 .880裤长 1.000 .494提取方法:主成份分析。

表5 公因子方差表5给出了每个变量共同度的结果。

该表左侧表示每个变量可以被所有因素所能解释的方差,右侧表示变量的共同度。

从该表可以得出,因子分析的变量共同度都比较高,表示变量中的大部分信息均能够被因子所体现,说明因子分析是有效的。

总方差解释组件初始特征值提取载荷平方和旋转载荷平方和总计方差百分比累积 % 总计方差百分比累积 % 总计方差百分比累积 %1 4.711 52.340 52.340 4.711 52.340 52.340 4.418 49.091 49.0912 1.878 20.864 73.204 1.878 20.864 73.204 2.170 24.112 73.2043 .709 7.880 81.0844 .591 6.569 87.6535 .346 3.840 91.4936 .307 3.410 94.9027 .214 2.382 97.2848 .142 1.582 98.8669 .102 1.134 100.000提取方法:主成份分析。

表6 总方差解释表6给出了因子贡献率的结果。

该表中左侧部分为初始特征值,中间为提取的主因子结果,右侧为旋转后的主因子结果。

“合计”指因子的特征值,其中只有前两个因子的特征值大于1,并且前两个因子的特征值之和占总特征值的73.204%,因此提取前两个因子作为主因子。

成分矩阵a组件1 2腰围.893 -.304腹围.855 -.286直裆1 .565 .631直裆2 .301 .801全浪.623 .347大腿根围.893 -.176膝盖围.845 -.106臀围.927 -.144裤长.118 .693提取方法:主成份分析。

a. 已提取 2 个成分。

表7 成分矩阵旋转后的成分矩阵a组件1 2腰围.943 -.001腹围.902 .004直裆1 .332 .779直裆2 .028 .856全浪.479 .529大腿根围.902 .120膝盖围.834 .171臀围.924 .161裤长-.110 .694提取方法:主成份分析。

旋转方法:Kaiser 标准化最大方差法。

aa. 旋转在 3 次迭代后已收敛。

表8 旋转后的成分矩阵表7给出了未旋转的因子载荷。

从该表可以得到利用主成分方法提取的两个主因子的载荷值。

为了方便解释因子含义,需要进行因子旋转。

表8给出了旋转后的因子载荷值,其中旋转方法是Kaiser标准化的正交旋转法。

通过因子旋转,各个因子有了比较明确的含义。

表9 碎石图表9给出了特征值的碎石图,通常该图显示大因子的陡峭程度和剩余因子平缓的尾部之间明显的中断。

一般选取的主因子在非常陡峭的斜率上,而在平缓斜率上的因子对变异的解释能力非常小。

从该图可以看出前两个因子都处在非常陡峭的斜率上,而从第三个因子开始斜率开始变得平缓,因此选择前两个因子作为主因子。

成分得分系数矩阵组件1 2 腰围 .231 -.092 腹围 .221 -.086 直裆1 .005 .357 直裆2 -.077 .425 全浪 .066 .217 大腿根围 .210 -.028 膝盖围 .188 .004 臀围 .211 -.010 裤长 -.095 .357 提取方法:主成份分析。

旋转方法:Kaiser 标准化最大方差法。

组件评分。

表10 成分得分系数矩阵通过成分得分系数矩阵可以看出,每个因子只有部分指标的因子载荷较大,因此可以根据上表对指标进行分类。

在第一个因子上因子载荷较大的有腰围、腹围、大腿根围、膝盖围和臀围,此类可以命名为胖瘦因子;在第二个因子上因子载荷较大的有直裆1、直裆2、全浪、裤长,此类命名为高矮因子。

由表10可得两个因子f 1、f 2的线性组合如下(腰围、腹围、直档1、直档2、全浪、大腿根围、膝盖围、臀围、裤长分别用x 1、x 2、x 3、x 4、x 5、x 6、x 7、x 8、x 9来表示):11234567890.2310.2210.0050.0770.0660.210.1880.2110.095f x x x x x x x x x =++-++++-21234567890.0920.0860.3570.4250.2170.0280.0040.010.357f x x x x x x x x x =--+++-+-+ 按以上2个线性组合计算因子得分,以各因子的方差贡献率占2个因子总方差贡献率的比重作为权重进行加权汇总,得到各人裤子尺寸的综合得分,即:12(52.3420.864)/73.204f f f =+。

相关主题