当前位置：文档之家› spss统计软件期末课程考试题

spss统计软件期末课程考试题

《SPSS统计软件》课程作业
要求：数据计算题要求注明选用的统计分析模块和输出结果；并解释结果的意义。

完成后将作业电子稿发送至
1. 某单位对100名女生测定血清总蛋白含量，数据如下：
计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度，并给出均值的置信水平为95%的置信区间。

解：
描述
统计量标准误
血清总蛋白含量均值.39389
均值的95% 置信区间下限
上限
5% 修整均值
中值
方差
标准差
极小值
极大值
范围
四分位距
偏度.054.241
峰度.037.478
样本均值为：；中位数为：；方差为：；标准差为：；最大值为：；最小值为：；极差为：；偏度为：；峰度为：；均值的置信水平为95%的置信区间为：【，】。

2. 绘出习题1所给数据的直方图、盒形图和QQ图，并判断该数据是否服从正态分布。

解：
正态性检验
Kolmogorov-Smirnov a Shapiro-Wilk
统计量
df Sig. 统计量
df Sig. 血清总蛋白含量
.073
100
.200*
.990
100
.671
a. Lilliefors 显着水平修正 *. 这是真实显着水平的下限。

表中显示了正态性检验结果，包括统计量、自由度及显着性水平，以K-S 方法的自由度sig.=,明显大于，故应接受原假设，认为数据服从正态分布。

3. 正常男子血小板计数均值为9
22510/L , 今测得20名男性油漆工作者的血小板计数值（单位：9
10/L ）如下：
220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无异常
解：
下表给出了单样本T检验的描述性统计量，包括样本数（N）、均值、标准差、均值的标准误差：
单个样本统计量
N均值标准差均值的标准误
血小板计数值20
本例置信水平为95%，显着性水平为，从上表中可以看出，双尾检测概率P值为，小于，故原假设不成立，也就是说，油漆工人的血小板计数与正常成年男子有异常。

4. 在某次考试中，随机抽取男女学生的成绩各10名，数据如下：
男：99 79 59 89 79 89 99 82 80 85
女：88 54 56 23 75 65 73 50 80 65
假设总体服从正态分布，比较男女得分是否有显着性差异。

解：
组统计量
性别N均值标准差均值的标准误
成绩a10
b10
上表给出了本例独立样本T检验的基本描述统计量，包括两个样本的均值、标准差和均值的标准误差。

根据上表“方差方程的Levene 检验”中的sig.为，远大于设定的显着性水平，故本例两组数据方差相等。

在方差相等的情况下，独立样本T检验的结果应该看上表中的“假设方差相等”一行，第5列为相应的双尾检测概率（Sig.（双侧））为，在显着性水平为的情况下，T统计量的概率p值小于，故应拒绝零假设,，即认为两样本的均值不是相等的，在本例中，能认为男女得分有显着性差异。

5. 设有5种治疗荨麻疹的药，要比较它们的疗效。

假设将30个病人分成5组，每组6人，令同组病人使用一种药，并记录病人从使用药物开始到痊愈所需时间，得到下面的记录：
问所有药物的效果是否一样
解：
上表是几种药物分析的结果，组间（Between Groups）平方和（Sum of Squares）为，自由度（df）为4，均方为；组内（Within Groups）平方和为，自由度为25，均方为；F统计量为。

由于组间比较的相伴概率Sig.（p值）=<，故应拒绝H0假设（五种药物对人的效果无显着差异），说明五种药物对人的效果有显着性差异。

通过上面的步骤，只能判断5种药物对人的效果是否有显着差异。

如果想进一步了解究竟是哪种药物与其他组有显着性的均值差别（即哪种药物更好）等细节问题，就需要在多个样本均值间进行两两比较。

由于第3步检验出来方差具有齐性，故选择一种方差相等的方法，这里选LSD方法；显着性水平默认取；
*.88318.048.0144
.88318.268
*. 均值差的显着性水平为。

从整个表反映出来五种药物相互之间均存在显着性差异，从效果来看是第1种最好。

上图为几种药物均值的折线图，可以看均值差异较大。

6. 某公司在各地区销售一种特殊化妆品。

该公司观测了15 个城市在某月内对该化妆品的销售量Y及各地区适合使用该化妆品的人数X1和人均收入X2，得到数据如下：
地区销售（箱）人数（千人）人均收入（元）11622742450 21201803254 32233753802 41312052838
567862347
61692653782
781983008 81923302450 91161952137
1055532560 112524304020 122323724427 131442362660 141031572088 152123702605
(1)画出这三个变量的两两散点图，并计算出两两之间的相关系数。

解：
相关性
人均收入X2销售Y
人均收入X2Pearson 相关性1.639*
显着性（双侧）.010
平方与叉积的和
协方差
N1515
销售Y Pearson 相关性.639*1
显着性（双侧）.010
平方与叉积的和
协方差
N1515
*. 在水平（双侧）上显着相关。

其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。

从表中可看出，相关系数为>0，说明呈正相关
其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。

从表中可看出，相关系数为>0，说明呈正相关
相关性
销售Y人数X1
销售Y Pearson 相关性1.995**
显着性（双侧）.000
平方与叉积的和
协方差
N1515
人数X1Pearson 相关性.995**1
显着性（双侧）.000
平方与叉积的和
协方差
N1515
**. 在.01 水平（双侧）上显着相关。

表格中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。

从表中可看出，相关系数为>0，说明呈正相关
(2) 12试建立Y 与X ，X 之间的线性回归方程，并研究相应的统计推断问题。

同时预测适合购买此化妆品的人数为220千人，人均收入为2500元的某城市对该化妆品的销量。

表中显示回归模型编号、进入模型的变量、移出模型的变量和变量的筛选方法。

可以看出，进入模型的自变量为“人均收入X2和人数X1” 。

R=，说明自变量与因变量之间的相关性很强。

R 方(R 2) =，说明自变量“人均收入和人数”可以解释因变量“销售量”的%的差异性。

表中显示因变量的方差来源、方差平方和、自由度、均方、F 检验统计量的观测值和显着性水平。

方差来源有回归、残差。

从表中可以看出，F 统计量的观测值为，显着性概率为，即检验假设“H0：回归系数B = 0”成立的概率为，从而应拒绝原假设，说明因变量和自变量的线性关系是非常显着的，可建立线性模型
表中显示回归模型的常数项、非标准化的回归系数B值及其标准误差、标准化的回归系数值、统计量t值以及显着性水平（Sig.）因此可以得到回归方程：Y=*X1+*X2 即，销售量=*人数+*人均收入。

回归系数的显着性水平为，明显小于，故应拒绝T检验的原假设，这也说明了回归系数的显着性，说明建立线性模型是恰当的。

那么当化妆品的人数为220千人，人均收入为2500元，代入到上面公式可以得到Y=*220000+*2500=元。

7. 研究青春发育阶段的年龄和远视率的变化关系，测得数据如下
请对年龄与远视率的关系进行曲线估计。

解：
模型汇总
三次曲线的方差分析图：
从决定系数（R方即R2）来看，三次曲线效果最好（因为其R2值最大），并且方差分析的显着性水平（Sig.）为0。

故重新进行上面的过程，只选“三次曲线（Cubic）”一种模型。

从表中可知因变量与自变量的三次回归模型为：
y=拟合效果图：
从图形上看，拟合效果很好。

8. 谈谈你对数理统计和统计软件课程的学习心得和想法，有何收获，有何建议等。

关于SPSS软件的学习已经有一段时间了，初次接触这个软件是在上次数学建模比赛，因为统计的需要，所以我就大概的了解了一下，这次通过系统的学习，发现自己对以前利用SPSS统计的数据已经有了更深的认识，知道了一些统计数据的具体涵义。

提到SPSS，我们初步学习了怎么分析一些数据；怎样利用图表来显示数据，使我们更加直观的通过图表来显示数据之间的关系；怎样通过探索分析，寻求数据之间的交错关系；知道了几种常见的统计方法：假设检验，方差分析，回归分析；有些情况下还要用到非参数
检验……总之，对SPSS的学习，感觉自己的知识又有了增加，而且通过这次学习，深刻的了解到了要学好数理统计的重要性，明白了数理统计也是学好这个软件，分析数据的基础；知道了理论与实践相结合的内涵，一定要在学好理论的基础上也要学会利用软件来处理一些问题，做到学有所用，融会贯通！。

e商务文档

spss统计软件期末课程考试题

相关文档推荐：