《统计分析软件》试(题)卷
班级xxx班xxx 学号xxx
说明:1.本试卷分析结果写在每个题目下面(即所留空白处);
2.考试时间为100分钟;
3.每个试题20分。
一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。
要求:
(1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.”
(2)对所建立的数据文件“成绩.sav”进行以下处理:
1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。
2)计算每个学生的总成绩、并按照总成绩的大小进行排序
3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。
分析:
(2)
描述统计量
性别N 极小值极大值均值标准差
男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4
女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16
注:成绩优良表示栏位sxcj 优为1 良为2 中为3
由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。
二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。
根据所给数据完成以下问题
(1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。
(2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。
分析:
Case Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
由表可得,Total项是应答次数,本例剔除缺失数据后为87次,第三列是应答百分比,分母87,第四列也是百分比,分母是样本29。
被调查者中有64.4%的人购买电脑未选择品牌,36.6%
分析得,购买电脑未选择品牌的人为文秘人员的有11人,工程师有16人,管理人员的最少,大部分人员为其他人;而选择品牌的人数都差不多。
三、(20分)入户推销有五种方法。
某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。
从尚无推销经验的应聘人员中随机挑选一部分,并随机地将他们分为五个组,每组用一种推销方法培训。
一段时期后得到他们在一个月的推销额,如下表所示(SPSS数据见“入户推销.sav”):
1.利用单因素方差分析方法分析这五种推销方式是否存在显著差异。
2.绘制各组的均值对比图,并利用LSD方法进行多重比较检验,说明那组推销方式最好?
分析:
不同推销方式下销售额的方差齐性检验值为2.046,对应的P值为0.113,如果显著水平为0.05,由于P值大于显著水平α,因此应接受原假设,认为推销方式没有对销售额产生影响,不同推销方式对销售额的影响全为0.
F统计量为11.304;3.892;123.775,对应的P值为0.000;0.058;0.000,如果显著水平为0.05,由于P值小于显著水平α,因此应拒绝原假设,认为推销方式对销售额产生影响,不同推销方式对销售额的影响不全为0。
多重比较销售额
LSD
(I) 推销方式(J) 推销
方式均值差(I-J) 标准误显著性
95% 置信区间
下限上限
第一组第二组-3.30000* 1.60294 .048 -6.5736 -.0264 第三组.72857 1.60294 .653 -2.5451 4.0022
第四组 3.05714 1.60294 .066 -.2165 6.3308
第五组-6.71429* 1.60294 .000 -9.9879 -3.4406 第二组第一组 3.30000* 1.60294 .048 .0264 6.5736 第三组 4.02857* 1.60294 .018 .7549 7.3022
第四组 6.35714* 1.60294 .000 3.0835 9.6308
第五组-3.41429* 1.60294 .041 -6.6879 -.1406 第三组第一组-.72857 1.60294 .653 -4.0022 2.5451 第二组-4.02857* 1.60294 .018 -7.3022 -.7549
第四组 2.32857 1.60294 .157 -.9451 5.6022
第五组-7.44286* 1.60294 .000 -10.7165 -4.1692
第四组第一组-3.05714 1.60294 .066 -6.3308 .2165 第二组-6.35714* 1.60294 .000 -9.6308 -3.0835
第三组-2.32857 1.60294 .157 -5.6022 .9451
第五组-9.77143* 1.60294 .000 -13.0451 -6.4978
第五组第一组 6.71429* 1.60294 .000 3.4406 9.9879 第二组 3.41429* 1.60294 .041 .1406 6.6879
第三组7.44286* 1.60294 .000 4.1692 10.7165
第四组9.77143* 1.60294 .000 6.4978 13.0451
*. 均值差的显著性水平为0.05。
四、(20分)利用“入户推销.sav”数据完成以下问题:
(1)按照性别建立推销员频率分布表及销售额的直方图;
(2)利用交叉列联表分析不同性别推销人员参与销售方式状况;
(3)利用参数检验来分析不同性别推销人员的销售额是否有显著性差异?
分析:
(1)
Statistics
性别性别销售额
男N Valid 19 19
Missing 0 0
女N Valid 16 16
Missing 0 0
性别
频率百分比有效百分比累积百分比有效男19 54.3 54.3 54.3 女16 45.7 45.7 100.0
合计35 100.0 100.0
(2)
女计数 3 3 3 4 3 16 期望的计数 3.2 3.2 3.2 3.2 3.2 16.0
性别中的% 18.8% 18.8% 18.8% 25.0% 18.8% 100.0%
推销方式中的% 42.9% 42.9% 42.9% 57.1% 42.9% 45.7%
总数的% 8.6% 8.6% 8.6% 11.4% 8.6% 45.7%
残差-.2 -.2 -.2 .8 -.2
标准残差-.1 -.1 -.1 .4 -.1
合计计数7 7 7 7 7 35 期望的计数7.0 7.0 7.0 7.0 7.0 35.0
性别中的% 20.0% 20.0% 20.0% 20.0% 20.0% 100.0%
推销方式中的% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%
总数的% 20.0% 20.0% 20.0% 20.0% 20.0% 100.0%
组统计量
性别N 均值标准差均值的标准误
销售额男19 22.4684 4.65284 1.06744
女16 22.6062 4.37088 1.09272
独立样本检验
方差方程的Levene 检验均值方程的t 检验
F Sig. t df Sig.(双侧) 均值差值标准误差值销售额假设方差相等.067 .798 -.090 33 .929 -.13783 1.53601 假设方差不相等-.090 32.571 .929 -.13783 1.52757
不同性别的销售人员对销售额无显著影响。
五、(20分)已知我国2003年部分地区城镇居民人均可支配收入和人均消费性
支出如下表所示:(单位:元)
(1)绘制城镇居民人均可支配收入与人均消费性支出的相关图(散点图);
(2)利用相关系数分析城镇居民人均可支配收入与人均消费性支出之间的关
系?
(3)如果有相关关系,建立一元线性回归模型,解释输出结果。
相关性
人均消费性支出Y 人均可支配收入X
人均消费性支出Y Pearson 相关性 1 .976**
显著性(双侧).000
N 26 26
人均可支配收入X Pearson 相关性.976** 1
显著性(双侧).000
N 26 26
**. 在 .01 水平(双侧)上显著相关。
城镇居民人均可支配收入与人均消费性支出之间存在高度相关关系。
(3)
系数a
模型非标准化系数标准系数
t Sig.
B 标准误差试用版
1 (常量) 354.693 294.520 1.204 .240
人均可支配收入X .739 .033 .976 22.169 .000 a. 因变量: 人均消费性支出Y
Y=354.693+0.739X
意味着人均可支配收入X每增加一个单位,就会使人均消费性支出Y增加0.739个单位。