(最新)社会统计学与spss应用练习题2010—2011学年第一学期《社会统计学与SPSS应用》练习题一、单项选择题1(只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有,与?的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量2(根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B) A.B.C.D.3(针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这说明新生婴儿性别状况属于(D)。
A.非统计现象B.统计现象C.非随机现象D.随机现象4(针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这体现新生婴儿性别状况具有(D)。
A.确定性B.因果性C.必然性D.随机性5(为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。
(B)A.完备B.互斥C.整体D.差异6(下列哪类变量能用折线图表示其分布状况,(C)A.定类变量B.定序变量C.定距变量D.虚拟变量7(下列某变量取值状况的累积图,其中正确的表现形式是(B)。
A( B(C( D(28(下两图是正态分布密度曲线,两图的σ相同,图1较之图2的密度曲线向左移了一些,这说明(C)。
图2 图1A.µ,µB.µ=µC.µ,µD.µ?µ 12 1212 129(在SPSS软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C)A. FrequenciesB. DescriptivesC. DefineVariables SetsD. Frequencies10(下图所示的若为了测量集中趋势,需要在哪个?前打“?”的是(B)。
A. QuartilesB.ModeC. VarianceD. Range11(下图包含两条正态分布密度曲线,它们的µ相同,那么上方曲线的σ与下1方曲线σ的关系是(C)。
2µA. σ,σB. σ=σC. σ,σD. σ?σ 12 1212 1212(下列哪类分布图形随着自由度k无限增加,逐渐趋于标准正态分布。
(D)2A.E分布 B. χ分布 C. F分布 D.t分布13(在进行区间估计时,置信度与显著性水平之和为(C)。
A. 0B. ,1C. 1D. 214(在进行区间估计时,显著性水平为α,置信度为(C)。
A. 0 B. ,α C. 1,α D. 2α15(在拒绝原假设时出现的错误称为(D)。
A.第二类错误B.纳伪的错误C.以假当真错误D.弃真的错误 16(大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A)。
A.标准差B.均值C.统计量分布D.临界值17(大样本二总体成数差进行统计检验时与单样本成数检验相比,主要区别是(A)。
A.标准差B.均值C.统计量分布D.临界值18(如下表所示,求出2×2表中相关强度φ系数为(C)。
群体划分消费状况市民民工30 10 大型超市消费场所10 30 小型商店A. 1B. 0.3C. 0.5D. 0.419(如下表所示,求出该表中同序对的个数为(B)。
父辈受教育状况大学中学小学10 6 3 大学8 10 7 子辈中学2 4 10 小学A.310B.624C.524D.314 20(两个定序变量之间Gamma系数取值范围为(A)。
A. [,1,1]B. [,?,0]C. [0,+?]D. [0,1]21(为测量两个定类变量相关系数,需要在下列哪项功能?前打“?”,(A)A. C.D.B.二、填空题1(所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分布。
2(在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精度要高一位,例如,原统计资料的年龄以年计算,统计范围为1~2岁、3~4岁、5~6岁、7~8岁等分为四组,实际分组为0.5~2.5岁、2.5~4.5岁、4.5~6.5岁、6.5~8.5岁等四组,那么,原统计资料的分组组界称为标明组界。
3(统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,这样才能构成一份完整的统计表。
4(某村家庭子女数量频次分布:2、3、1、4、2、4、3、2、1、2、0、1、2、3、1、3、2、0、4、2,在家庭子女数量这个变量取值中众值是 2 。
5(某社区六个家庭人口数量分布:3、4、5、8、9、9在家庭人口数量这个变量取值中中位值是6.5 。
6(方差与标准差用来度量定距变量的离散程度的测量方法。
7(当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随机变量的概率分布。
8(古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率。
9(统计推论的基础是概率论,内容包括两部分:参数估计与假设检验。
10(从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量ξ,1ξ,……,ξ,那么,随机变量ξ,ξ,……,ξ的任何函数f( ξ,ξ,……,2n12n12ξ)也是随机变量。
我们把函数f( ξ,ξ,……,ξ)叫作统计量。
n 12n 11(根据随机变量的观测值X , X ,……, X计算得到的一切统计数字特12n 征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布。
12(原假设(H)又称虚无假设或解消假设,常常是根据已有的资料,或根据周0 密考虑后确定的。
13(备择假设(H)又称为研究假设,当经过抽样调查,有充分根据否定原有假1 设时,就产生了需要接受其逻辑对立面的假设。
14(假设检验的基本原理是小概率原理。
15(在某个列联表中,只观察其中某一变量的分布,而不管另一个变量的取值,这样就得到边缘分布。
16(协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差。
17(两个定距变量的相关系数r是度量变量间的线性相关程度的,具有PRE性质,r 的平方又称为判定系数有着直观的解释意义。
18(方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同。
19(方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率。
20(非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法。
21(非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定,也不是检验总体分布的某些参数,而是检验总体某类有关的性质。
三、判断题(根据题意,表述正确的在后面括号内打“?”,表述错误的在后面括号内打“×”)1(在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况。
(×) 2(在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。
(?) 3(直方图可以用来反映定类变量的取值状况。
(×)4(直方图与条形图形状相同,没有什么本质区别。
(×)5(中位值比较适用于定距变量。
(×)6(某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。
(×) 7(某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠。
(×) 8(统计推论是根据局部资料(样本资料)对总体的特征进行推断。
(?) 9(“抽样结果与总体参数不一致”是随机现象在推论中所特有的。
(?)210(总体分布为正态分布N(µ,σ),且方差已知,随着样本容量n的增加,也不能减少样本均值抽样分布的分散程度。
(×)11(若总体分布为正态分布,且方差已知,样本均值分布服从t分布。
(×)12(若总体分布为正态分布,大样本均值的极限分布不是N(0,1)。
(×) 13(在区间估计中,置信度表示用置信区间估计的可靠性。
(?) 14(在区间估计中,显著性水平表示用置信区间估计不可靠的概率。
(?) 15(大样本二总体均值差的分布不服从正态分布。
(×)16(大样本二总体成数差的分布不服从正态分布。
(×)217(两个定类变量之间以χ为基础的相关性测量得到C系数具有减少误差比例性质。
(×)18(两个定类变量之间相关性测量得到λ系数不具有减少误差比例性质。
(×) 19(Gamma等级相关的G系数具有减少误差比例的性质。
20(斯皮尔曼等级相关系数r具有减少误差比例的性质。
s四、计算题(要求步骤完整,计算结果正确)1(根据下表2008年某班级Q课程成绩统计分布情况,求某班级Q课程成绩的中位值。
2008年某班级Q课程成绩统计分布情况成绩等级频次累计频次3 3 不及格12 15 及格18 33 中22 55 良好5 60 优秀2(根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中位值。
某城市抽样调查家庭月收入统计分布情况家庭月收入频次累计频次(cf?) 累计百分比(%)10 10 10 500及以下500—1000 20 30 301000—2000 35 65 652000—3000 25 90 9010 100 100 3000及以上3(下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况: 社区类别抽样数量(个) 受教育年限分布状况(年)A 5 7、3、11、10、4B 6 6、5、5、8、10、8 根据抽样数据,求出两个社区的平均受教育年限各是多少,相同吗, 4(某系大学一年级共550人,Z课程期末考试成绩统计如下表,求该课程的平均分数是多少,某系大学一年级Z课程期末考试成绩统计分布状况分数学生数量50 1560 2863 4070 29074 16080 17550 总和5(针对某村返乡人口状况进行调查,抽取11户大型联合家庭进行调查,各自家庭返乡人口数量分别为:2、2、3、4、4、4、5、5、6、6、7。
求样本中返乡人口数量的四分互差是多少,答案:Q=36(为了解某种新型奶制品的消费者偏好状况,访问了80个消费者,其中,选择喜欢的有25个,选择一般的有30个,选择不喜欢的有20个,选择无所谓的有5个。
求反映偏好状况的四分互差是什么,答案:有50%的消费者在喜欢与不喜欢之间。
27(设某工厂妇女从事家务劳动时间服从正态分布N(µ,0.66)。
根据36人的随机抽样调查,每天平均从事家务劳动时间为2.65小时,求µ的双侧置信区间(置信度0.95,Z=1.96,保留小数点后两位) α/2答案:[2.44,2.87]8(为了对某工厂职工休闲时间进行研究。