第一部分 数据整理考试题1建立以下数据的数据文件:对所建立的数据文件进行以下处理:⑴计算每个学生的总成绩、平均成绩,并按照总成绩的大小进行排序(转换-计算变量,数据-排序个案)⑵设Z Y X 、、分别表示语文、数学、化学,对称其进行以下处理: ①X X =' ②5+='Y Y (x1=sqrt(x)) ③对化学成绩,若是男生,5+='Z Z (转换-计算变量)若是女生:10+='Z Z ④把数学成绩分成优、良、中三个等级,规则为优(X ≥85),良(75≤X ≤84),中(X ≤74),并进行汇总统计。
(转换-重新编码为不同变量,频数分析)2 在一次智力测验中,共有10个选择题,每题有A,B,C,D 四个答案,8个被测对象的答卷如下表。
已知第1、6、10题的正确答案为A ,第4、5、7、8题的正确答案为B, 第2、9题的正确答案为C, 第3题的正确答案为D,请建立合适的数据文件,统计每个被测对象的总成绩(满分100)。
(转换-对个案内的值计数,选择题号,再定义值 A or B C D 然后添加,转换-计算变量,Q+W+E+R 再乘以10就是总成绩)3某个汽车收费站在每10分钟内统计到达车辆的数量,共取得20次观察数据,分别是:27、30、3l 、33、16、20、34、24、19、27、21、28、32、22、15、33、26、26、38、24,现要求以5为组距,对上述资料进行分组整理。
(再重新转换-重新编码为不同变量)4 练习加权处理功能:⑴练习课本案例3-8(p84).(加权销售量,再分析-描述统计-描述,只添加单价,均值即是当天平均价格)⑵下表是某大学一个系的学生按照年级、性别和年龄复合分组的人数的资料。
要求:首先建立合适的数据文件,其次计算全校学生的平均年龄以及每个年级的平均年龄。
(加权人数,分析-比较均值-均值,因变量是年龄,自变量是年级)5练习spss随机数的产生方法。
⑴利用Spss的变量计算功能,随机生成服从标准正态分布的10个样本数据。
(转换-计算变量-函数全部找(0,1))⑴利用Spss的变量计算功能,随机生成服从参数为2的指数分布的15个样本数据。
(转换-计算变量-函数全部找(2))第二部分描述性统计分析考试题6 下表为10个人对两个不同的问题作出的回答(回答为“Yes”或“No”)后得到的数据,要求,建立数据文件,利用SPSS为该数据创建频数分布表。
(分析-描述统计-频率--全部变量加进去)7 调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数表分析。
(1)、建立数据文件并输入数据,并保存数据。
(2)、对女大学生的血清总蛋白含量进行频数分析(Frequencies),做出频数表,并做出直方图,计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误、偏度系数(Skewness)和峰度系数(Kurtosis)。
(分析-描述统计-频率)(3)、并对此数据进行整理,进行统计分组,已知最小值为,最大值为,全距为,故可分成10组,起点为,组距为,对新变量进行频数分析(Frequencies)。
要求作出频数表和条形图。
(转换-重新编码为不同变量,分析-描述统计-频率)8 调查20名男婴的出生体重(克)资料如下,试作描述性统计。
利用描述性统计(Descriptives)可对变量进行描述性统计分析,计算并列出一系列相应的统计指标(集中趋势指标、离中趋势指标、分布指标),且可将原始数据转换成标准Z分值并存入数据库(分析-描述统计-描述-将标准化得分另存为变量)。
(1)、建立数据文件并输入数据,并保存数据。
(2)、描述性统计分析,计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误、偏度系数(Skewness)和峰度系数(Kurtosis)。
(分析-描述统计-频率)9 下列列出3个民族的血型分布数据,为了统计各个民族和各种血型的人数,选择合适的结构将此组输入到SPSS数据窗口建立数据文件。
(加权人数)要求,分别按照民族和血型作出频数表和条形图(分析-描述统计-频率)10 下表为30名10岁少儿的身高(cm)资料,试作探索性分析。
它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。
(分析-描述统计-探索)11 某医师测得如下血红蛋白值(g%),试作基本的描述性统计分析:注:分性别计算各组的均数和标准差,则用Means过程更显简单快捷。
(分析-比较均值-均值,年龄,下一张,性别)12进行住房和社区服务问题调查,从中抽取了20份调查结果,见下表,其中调查了住户的住房是自购还是租用以及对社区服务的满意度。
要求:⑴建立spss数据文件“住房和社区服务.sav”;⑵对住房状况与社区服务进行频数分析。
(分析-描述统计-频率)⑶分析住户方式与对社区服务的态度间的关系。
(分析-描述统计-交叉表)13下表为随机抽查148人后,得到的人的出生季节与检测的智力高低结果,其中IQ为智力单位(通常认为人的智力小于70IQ),研究人的出生季节对智力的影响。
(人数加权,分析-描述统计-交叉表)14为了探讨吸烟与慢性支气管炎有无关系,调查了339人,试在水平下检验吸烟与患病是否有关系?(人数加权,分析-描述统计-交叉表,统计量-卡方,相关性)15为了考察法院判决是否与被告种族有关,调查了326为被告的判决情况:试在水平检验判决结果与被告种族是否独立。
(人数加权,分析-描述统计-交叉表,统计量-卡方,相关性)16 统计选票。
候选人5人(张莉一l,黄丽一2,代天华一3,刘潇一4,封亚东一5),投票人20人(按职业分类:学生一1,教师一2),在候选人中选三人(不得重复)。
统计结果如下表所示:要求⑴利用SPSS软件,计算各人的得票数,谁会当选?⑵作出不同职业与各人得票交叉列联表。
(分析-多重响应,类别 1-5,再频数,交叉表分析)17 为了解笔记本电脑的市场情况,针对笔记本电脑的6种品牌,进行了满意度调查,随机访问了35位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;6个品牌变量的取值中,1表示选择,0表示未选,试利用多选项分析,研究各品牌的消费者满意度。
(分析-多重响应,二分法-1,再频数,交叉表分析)18 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示:A. 好;B. 较好;C. 一般;D. 差;E. 较差。
(1)指出数据集中的数据属于什么类型。
(数值,字符)(2)用SPSS制作一张频数分布表。
(分析-描述统计-频率)(3)绘制一张条形图,反映评价等级的分布。
(分析-描述统计-频率-条形图)19 某行业管理局所属40个企业2002年的产品销售收入(单位:万元)。
进行适当的分组(转换-重新编码为不同变量)编制频数分布表,并计算出累计频率。
(分析-描述统计-频率)20 某百货公司连续40天的商品销售额见。
进行适当的分组(转换-重新编码为不同变量)编制频数分布表,并绘制直方图。
(分析-描述统计-频率,直方图)21 为了确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试。
(1)用SPSS 对数据进行排序。
(数据-排序个案)(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图。
(转换-重新编码为不同变量)(3)制作茎叶图(分析-描述统计-探索-茎叶图),并与直方图作比较。
22 给出A,B两个班学生的数学考试成绩(单位:分)。
(1)用SPSS制作变量“数学成绩”的,包含所有观测值的盒形图。
(分析-描述统计-探索)(2)用SPSS制作变量“数学成绩”的,以班级分组的盒形图。
(因子列表是班级)(3)分别就A班和B班制作变量“数学成绩”的直方图。
(分析-描述统计-探索-直方图)(4)简要叙述两个班组数学成绩分布的异同之处。
23 北方某个城市1月份——2月份各天气温的记录数据。
(1)指出数据集中的数据属于什么类型;(数值)(2)对数据进行适当的分组;(转换-重新编码为不同变量)(3)绘制直方图,说明该城市气温分布的特点。
(分析-描述统计-频率)24 对10名成年人和10名幼儿的身高(单位:厘米)进行抽样调查。
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?(标准差说明波动情况,均值说明身高水平)(2)比较分析哪一组的身高差异大。
(分析-描述统计-描述)第三部参数估计25 某大学为了了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取37人,调查他们每周上网的时间(单位:小时),求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。
(分析-比较均值-单样本T 检验-在选项里修改置信区间)某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:千米),求职工上班从家里到单位平均距离95%的置信区间。
(分析-比较均值-单样本T 检验)从一个正态总体中随机抽取容量为8的样本。
求总体均值95%的置信区间。
(分析-比较均值-单样本T 检验)第四部分 假设检验27 某轮胎厂的质量分析报告中说明,该厂某轮胎的平均寿命在一定的载重负荷与正常行驶条件下会大于25000公里。
平均轮胎寿命的公里数近似服从正态分布。
现对该厂该种轮胎抽取一容量为15个的样本,试验结果得样本均值为27000公里。
要求写出原假设(与25000没有差异)和备择假设(与25000有差异),根据T 检验表,能否做出结论:该厂产品与申报的质量标准相符?(分析-比较均值-单样本T 检验与25000比较)结果:接受原假设,合格29 为了评价两个学校的教学质量,分别在两个学校抽取样本 。
在A 学校抽取30名学生,在B 学校抽取40名学生,对两个学校的学生同时进行一次英语标准化考试。
假设学校A 考试成绩的方差为64,学校B 考试成绩的方差为100。
检验两个学校的教学质量是否有显着差异。
(α=?(分析-比较均值-独立样本T 检验,上加成绩,下加学校,定义组1,2 接受原假设,认为方差相等,看)30 用某种药物治疗9例再生障碍性贫血患者,血红蛋白变化的数据如下表。