湛江师范学院2014年-2015学年度第 01 学期期中考试试题A卷参考答案(考试时间: 120 分钟)考试科目:《社会统计学》一、单项选择题(在答题栏中填上正确选项的序号,每小题1分,共14分)1. 学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是()A.22000名学生B.2200名学生C.22000名学生的每月生活费用D.2200名学生的每月生活费用2. 定距变量不具有的数学特质是()A.=,≠B.>,<C. +,-D. ×,÷3.“4、6、8、10、12、26”这组数据的集中趋势宜用()测量。
A.众值B.中位值C.均值D.标准值4.有8 户人家,每户人口数分别为5,2,4,7,8,10,4,10,则中位值等于()A.5 B.7 C.7.5 D.65.若根据下列的数据去作一个次数分布表:3个人的分数是在80至84之间,5个人的分数是85至89 之间,2 个人的分数是90至94之间。
那么下列哪一个是组距?()A.80—84 B.5 C.7 D.106.调查某地区100户家庭,按家庭订购报刊份数分组资料如下。
根据上述资料计算的众数为()A. 1B. 57C. 2D.37. 一个学生提前20分钟到达,四个学生提前10分钟到达,十个学生提前5分钟到达,十四个学生提前2分钟到达,只有两位学生迟到。
这些学生到达时间的分布是()A 正态B 钟型C 对称D 偏态8.在正态分布曲线中,当均值不变,方差变小时,则对应曲线()A.右移 B.左移 C.变尖D.变矮胖9.已知随机变量X服从正态分布N(3,σ2),则P(X<3)等于()A. 0B. 1/3C. 1/2D. 不能得出结果10.某相关测量值为-0.5,它可能是()A.相关比率B.λ系数C.Gamma系数 D.Tau-y11.某跨栏运动员平时训练名次与正式比赛所获名次之间的相关分析可以使用()A. λ系数B. eta系数C. r系数D. d y系数12.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r()A、-1 < r< 0B、0 < r< 1C、r = 1D、r = -113.下列关于“回归分析和相关分析的关系”的说法中不正确的是()A.回归分析可用于估计和预测B.相关分析是研究变量之间的相互依存关系的密切程度C.相关分析不需区分自变量和因变量D .回归分析是相关分析的基础14.相关比率测量法是以( )作为预测的准则A .众值B .标准差C .均值D .每对个案的相对等级二、多项选择题,至少两个答案正确,少选,多选给零分计算。
(在答题栏中填上正确选项的序号,每小题2分,共 16分)1.下列变量中属于定类层次的是( )A 、教育程度B 、专业C 、班级D 、考试分数E 、学号2. 下列基本技术中不适用于分类数据的是( )A. 比例B. 比率C. 累加百分率D. 饼图E.散点图3.数据离散程度的测度值中,不受极端值影响的是( )A.全距(课本第59页)B.异众比率C.四分位差D.十分位差E.标准差4.下列关于消减误差比例的说法正确的有( )A. 可适用于变量的各测量层次B. 可适用于对称或不对称的两变量C. 取值范围是 [0,1]D. E 1表示在知道X 的情况下,预测Y 所产生的全部误差E. 如果E 1=E 2,则反映X 与Y 无相关5.下列关于Gamma 系数的说法正确的有( )A. 是一种对称测量B. N s 和N d 相差越大,两个变量的相关越强C. N s 和N d 相差越小,两个变量的相关越弱D. 以每对个案之间的相对等级作为预测的准则E. 一般Gamma 系数比d y 系数大 6.以下系数中具有消减误差比例意义的有( )A .λ系数B .Gamma 系数C .eta 系数(E) D.回归系数 E .r 27.简单线性回归分析中的回归系数b 可以表示( )A 、两个变量之间相关关系的密切程度B 、两个变量之间相关关系的方向C 、当自变量增减一个单位时,因变量平均增减的量D 、当因变量增减一个单位时,自变量平均增减的量E 、回归模型的拟合优度8.相关比率可以分析( ) A. 一个定类变量与一个定距变量B. 一个定类变量与一个定序变量C. 一个定序变量与一个定距变量D. 两个定序变量E. 两个定距变量的非线性关系三、判断题(在括号中填上“√”或“×”,每小题1分,共10分)[ √ ] 1.某电视台抽取100人进行民意调查,发现其中有55人支持普选,支持率为55%。
这里体现的是描述统计法。
[ × ] 2.定序测量层次的变量肯定不能用众值测量。
[ √ ] 3.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。
[ × ] 4.标准差愈大,表明该总体的中位值的代表性愈差。
[ √ ] 5.若某同学英语考试成绩的标准值为零,则表示他的成绩正好等于平均分数。
[ × ] 6.PRE 值越小,用X 预测Y 所产生的误差就越小,说明X 与Y 的相关程度就越高。
[ √ ] 7.在次数表中,如果是以同序对为主,则表示变量X 和变量Y 呈正相关。
[ × ] 8.积矩相关系数r=0 表示X 与Y 不相关。
[ × ] 9.Eta 系数测量要求自变量为定距或以上测量层次,因变量为定类测量层次。
[ × ] 10.回归系数是一种对称测量。
三、简答题(每小题5分,共15分)1.举例简要说明社会研究过程。
例如:(答案不唯一,有举例解释2分,研究过程3分)1.确定课题:研究某国公民犯罪与否与其文化程度的关联性2.初步探索:通过查阅文献3.建立假设:文化程度越低,越容易犯罪4.理论解释和澄清概念: 文化程度定义为受学校教育的年限5.设计问卷6.试填问卷7.调查实施8.资料整理:问卷的核对、登录9.统计分析与命题检验2.条形图(长条图)和直方图(矩形图)有什么区别?1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的(2分)2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义(2分)3.直方图的各矩形通常是连续排列,条形图则是分开排列(1分)或:直方图用于定距以上测量层次的数据,条形图用于定类数据(1分)3.简述相关分析和回归分析之间的联系。
一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。
相关程度越高,回归预测越准确。
因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。
(2分,只要体现相关分析是回归分析的前提和基础即可) 与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数r 的PRE 性质。
回归分析可用于估计和预测,而相关分析从本质上讲只是对客观事物的一种描述,不知道变量间是否有因果关系。
因而从分析层次上讲,回归分析更深刻一些。
(3分,只要体现回归分析是相关分析的深入/表现相关的具体数量关系即可)四、计算题(要求写出过程,结果保留两位小数,共4题,第一题15分,第二题和第三题各9分,第四题12分,共45分)1. 岭南师范学院社会工作专业某班学生的统计学成绩如下表所示。
(直接用标示上/下限即可,不用考虑真实上/下限)求: (1)在表中写上:①组中值 ②累加频数 ③累加频率; [3分] (2)计算①均值 ②第一四分位数(Q 1) ③离异比率 ④方差 [12分]某班同学统计学成绩分组数据表1. 77302310===∑∑fxf x 乙2. N/4=7.5, 所以Q1所在组为60-70L LLL L i f S N L Q ⨯-+=486.67107243060=⨯-+= L Q2. v= (n-fmo)/n =(30-9)/30=0.73. 136304080)(22==-=∑∑ff x x σ2.某公司招聘职员时,要求对职员进行两项基本能力测试。
已知,A 项测试中平均分数为90分,标准差是12分;B 考试中平均分数为200分,标准差为25分。
一位应试者在A 项测试中得了102分,在B 项测试中得了215分。
若两项测试的成绩均服从正态分布,(1)该位应试者哪一项测试更理想?[5分](2)若B 项测试的合格通过率为30%,该应试者能否合格通过?[4分]()()223102070054037053104027405-⨯-⨯⨯-⨯=()2.54037053104027405222=-⨯⨯-⨯=--=∑∑∑∑∑x x n y x xy n b (1)11290102=-=-=A A A A s x x z (2分) 6.025200215=-=-=B B B B s x x z (2分)A z >B z ,所以A 项测试更理想 (1分)(2)P(X>215)=0.5-P(X<215)=0.5-P(0.6)=0.5-0.2257=0.2743<30% (3分) 所以能合格通过(1分)3.随机调查某地区中学生的升学意愿,得到结果如下表。
试对学生类型与升学意愿两者之间的关系进行测量并简略提出研究结论。
(9分)解:上表可变成以下的次数分布表(3分):(学生类型与升学意愿两者都是二分变量,所以都可以看做定类或者定序的变量。
此处应为不对称关系。
因此,用tau-y 系数、Gamma 系数或Q 系数都行,但用Lambda 系数的要酌情扣1-3分)Tau-y = (E1-E2)/E1=124.83-123.59/124.83=0.01G (或Q )=(243*15-29*66)/(243*15-29*66)= 0.31 (5分,其中选对系数2分,公式和正确数字代入2分,结果1分)研究结论:学生类型与升学意愿两者有较弱的(正)相关关系,用学生类型预测升学意愿可以消减1%(或31%)的误差 (1分)4.(12分)检查五位同学《统计学》的学习时间与成绩分数如下表所示。
根据资料:(1)由此计算出学习时数与学习成绩之间的r 及r 2;[4分](2)建立学习成绩(y )依学习时间(x )的线性回归方程。
[5分] (3)依据r, r 2与回归系数值b ,简略提出研究结论。
[3分] 提示:40=∑x 310=∑y 2740=∑xy 3702=∑x 207002=∑y(1)计算相关系数])(][)([2222∑∑∑∑∑∑∑---=y y n x x n yx xy n γ=0.956 (3分) r 2=0.914 (1分)(2)编制直线回归方程:bx a y c +=[2分]4.205402.5310=⨯-=-=∑∑nx b y a[2分]回归方程为:x y c 2.54.20+= [1分](3) r 显示两变项成高度线性正相关[1分],而r 2则显示X 可以解释91%左右的Y 方差。