《统计分析软件》试(题)卷班级xxx班姓名xxx 学号xxx题号一二三四五六总成绩成绩说明:1.本试卷分析结果写在每个题目下面(即所留空白处);2.考试时间为100分钟;3.每个试题20分。
一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。
要求:(1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.”(2)对所建立的数据文件“成绩.sav”进行以下处理:1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。
2)计算每个学生的总成绩、并按照总成绩的大小进行排序3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。
分析:(2)描述统计量性别N 极小值极大值均值标准差男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16注:成绩优良表示栏位sxcj 优为1 良为2 中为3由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。
二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。
根据所给数据完成以下问题(1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。
(2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。
分析:Case SummaryCasesValid Missing TotalN Percent N Percent N Percent $set1a29 96.7% 1 3.3% 30 100.0% a. Group$set1 FrequenciesResponsesPercent of CasesN Percent消费者的不同品牌的满意程度a 未选56 64.4% 193.1% 选择31 35.6% 106.9%Total 87 100.0% 300.0%Case SummaryCasesValid Missing TotalN Percent N Percent N Percent$set1a29 96.7% 1 3.3% 30 100.0%由表可得,Total项是应答次数,本例剔除缺失数据后为87次,第三列是应答百分比,分母87,第四列也是百分比,分母是样本29。
被调查者中有64.4%的人购买电脑未选择品牌,36.6%Case SummaryCasesValid Missing TotalN Percent N Percent N Percent职业*$set1 29 96.7% 1 3.3% 30 100.0%职业*$set1 Crosstabulation消费者的不同品牌的满意程度a未选选择Total职业文秘人员Count 11 7 6管理人员Count 4 8 4工程师Count 16 8 8其他人Count 25 8 11Total Count 56 31 29Percentages and totals are based on respondents.a. Group分析得,购买电脑未选择品牌的人为文秘人员的有11人,工程师有16人,管理人员的最少,大部分人员为其他人;而选择品牌的人数都差不多。
三、(20分)入户推销有五种方法。
某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。
从尚无推销经验的应聘人员中随机挑选一部分,并随机地将他们分为五个组,每组用一种推销方法培训。
一段时期后得到他们在一个月内的推销额,如下表所示(SPSS数据见“入户推销.sav”):第一组20.0 16.8 17.9 21.2 23.9 26.8 22.4第二组24.9 21.3 22.6 30.2 29.9 22.5 20.7第三组16.0 20.1 17.3 20.9 22.0 26.8 20.8第四组17.5 18.2 20.2 17.7 19.1 18.4 16.5第五组25.2 26.2 26.9 29.3 30.4 29.7 28.31.利用单因素方差分析方法分析这五种推销方式是否存在显著差异。
2.绘制各组的均值对比图,并利用LSD方法进行多重比较检验,说明那组推销方式最好?分析:Test of Homogeneity of Variances销售额Levene Statistic df1 df2 Sig.2.046 4 30 .113不同推销方式下销售额的方差齐性检验值为2.046,对应的P值为0.113,如果显著水平为0.05,由于P值大于显著水平α,因此应接受原假设,认为推销方式没有对销售额产生影响,不同推销方式对销售额的影响全为0.显著水平为0.05,由于P值小于显著水平α,因此应拒绝原假设,认为推销方式对销售额产生影响,不同推销方式对销售额的影响不全为0。
多重比较销售额LSD(I) 推销方式(J) 推销方式均值差(I-J) 标准误显著性95% 置信区间下限上限第一组第二组-3.30000* 1.60294 .048 -6.5736 -.0264 第三组.72857 1.60294 .653 -2.5451 4.0022第四组 3.05714 1.60294 .066 -.2165 6.3308第五组-6.71429* 1.60294 .000 -9.9879 -3.4406 第二组第一组 3.30000* 1.60294 .048 .0264 6.5736 第三组 4.02857* 1.60294 .018 .7549 7.3022第四组 6.35714* 1.60294 .000 3.0835 9.6308第五组-3.41429* 1.60294 .041 -6.6879 -.1406 第三组第一组-.72857 1.60294 .653 -4.0022 2.5451 第二组-4.02857* 1.60294 .018 -7.3022 -.7549第四组 2.32857 1.60294 .157 -.9451 5.6022第五组-7.44286* 1.60294 .000 -10.7165 -4.1692第四组第一组-3.05714 1.60294 .066 -6.3308 .2165 第二组-6.35714* 1.60294 .000 -9.6308 -3.0835第三组-2.32857 1.60294 .157 -5.6022 .9451第五组-9.77143* 1.60294 .000 -13.0451 -6.4978第五组第一组 6.71429* 1.60294 .000 3.4406 9.9879 第二组 3.41429* 1.60294 .041 .1406 6.6879第三组7.44286* 1.60294 .000 4.1692 10.7165第四组9.77143* 1.60294 .000 6.4978 13.0451*. 均值差的显著性水平为0.05。
四、(20分)利用“入户推销.sav”数据完成以下问题:(1)按照性别建立推销员频率分布表及销售额的直方图;(2)利用交叉列联表分析不同性别推销人员参与销售方式状况;(3)利用参数检验来分析不同性别推销人员的销售额是否有显著性差异?分析:(1)Statistics性别性别销售额男N Valid 19 19Missing 0 0女N Valid 16 16Missing 0 0性别频率百分比有效百分比累积百分比有效男19 54.3 54.3 54.3女16 45.7 45.7 100.0合计35 100.0 100.0(2)性别* 推销方式交叉制表推销方式第一组第二组第三组第四组第五组合计性别男计数 4 4 4 3 4 19 期望的计数 3.8 3.8 3.8 3.8 3.8 19.0性别中的% 21.1% 21.1% 21.1% 15.8% 21.1% 100.0%推销方式中的% 57.1% 57.1% 57.1% 42.9% 57.1% 54.3%总数的% 11.4% 11.4% 11.4% 8.6% 11.4% 54.3%残差.2 .2 .2 -.8 .2标准残差.1 .1 .1 -.4 .1 女计数 3 3 3 4 3 16 期望的计数 3.2 3.2 3.2 3.2 3.2 16.0性别中的% 18.8% 18.8% 18.8% 25.0% 18.8% 100.0%推销方式中的% 42.9% 42.9% 42.9% 57.1% 42.9% 45.7%总数的% 8.6% 8.6% 8.6% 11.4% 8.6% 45.7%残差-.2 -.2 -.2 .8 -.2标准残差-.1 -.1 -.1 .4 -.1合计计数7 7 7 7 7 35 期望的计数7.0 7.0 7.0 7.0 7.0 35.0性别中的% 20.0% 20.0% 20.0% 20.0% 20.0% 100.0%推销方式中的% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%总数的% 20.0% 20.0% 20.0% 20.0% 20.0% 100.0%组统计量性别N 均值标准差均值的标准误销售额男19 22.4684 4.65284 1.06744 女16 22.6062 4.37088 1.09272不同性别的销售人员对销售额无显著影响。
五、(20分)已知我国2003年部分地区城镇居民人均可支配收入和人均消费性支出如下表所示:(单位:元)(1)绘制城镇居民人均可支配收入与人均消费性支出的相关图(散点图);(2)利用相关系数分析城镇居民人均可支配收入与人均消费性支出之间的关系?(3)如果有相关关系,建立一元线性回归模型,解释输出结果。
地区人均消费性支出(Y)人均可支配收入(X)地区人均消费性支出(Y)人均可支配收入(X)北京11123.8 13882.6 湖北5963.3 7322 天津7867.5 10312.9 湖南6082.6 7674.2 河北5439.8 7239.1 广东9636.3 12380.4 山西5105.4 7005 广西5763.5 7785 内蒙古5419.1 7012.9 海南5502.4 7259.3 辽宁6077.9 7240.6 重庆7118.1 8093.7 吉林5492.1 7005.2 四川5759.2 7041.9 黑龙江5015.2 6678.9 贵州4949 6569.2 上海11040.3 14867.5 云南6023.6 7643.6 江苏6708.6 9262.5 西藏8045.3 8765.5 浙江9712.9 13179.5 陕西5666.5 6806.4 安徽5064.3 6778 甘肃5298.9 6657.2 福建7356.3 9999.5 青海5400.2 6745.3相关性人均消费性支出Y 人均可支配收入X人均消费性支出Y Pearson 相关性 1 .976**显著性(双侧).000N 26 26人均可支配收入X Pearson 相关性.976** 1显著性(双侧).000N 26 26**. 在 .01 水平(双侧)上显著相关。