应用练习题spss社会统计学与2011—2012学年第二学期《社会统计学与SPSS应用》练习题一、单项选择题1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A)A.定类变量B.定序变量C.定距变量D.定比变量2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B)A.B.C.D.左50%3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这说明新生婴儿性别状况属于(D)。
随机现象 D. A.非统计现象 B.统计现象 C.非随机现象左新生婴儿男女性别比一直在针对出生婴儿性别状况的多年调查发现,50%4.右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这体现)。
新生婴儿性别状况具有(D必然性 D.随机性 A.确定性 B.因果性 C..为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少5 年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。
(B)差异D.整体C.互斥B.完备A.C)6.下列哪类变量能用折线图表示其分布状况?(虚拟变量定类变量 B.定序变量 C.定距变量 D.A. 。
7.下列某变量取值状况的累积图,其中正确的表现形式是(B).BA..CD.2相同,图1较之图2的密度曲线向左8.下两图是正态分布密度曲线,两图的σ移了一些,这说明(C)。
图图≥ D.μμ< C.μμ =μB.μμ>A.μ22112 112 21)C(如下所示首先应该操作步骤的是对于多选项分析而言,软件中,SPSS 在.9.A.B.FrequeDescrncies ptivesC.Defin D. eFreque Varia).下图所示的若为了测量集中趋势,需要在哪个□前打“√”的是(10B。
ncies blesSetsA.QuaB.tiloseC.D.Var Rangancee11.下图包含两条正态分布密度曲线,它们的μ相同,那么上方曲线的σ与下1方曲线σ的关系是(C)。
2μ≥σ D. σ<C. σσσB. >A. σσσ= 2112 2 112)k无限增加,逐渐趋于标准正态分布。
(D.下列哪类分布图形随着自由度122 D.t分布 C. F分布分布A.E B. χ分布。
C13.在进行区间估计时,置信度与显著性水平之和为()D. 2C. 1 1 -B. A. 014.在进行区间估计时,显著性水平为α,置信度为(C)。
A. 0B. -αC. 1-αD. 2α15.在拒绝原假设时出现的错误称为(D)。
A.第二类错误B.纳伪的错误C.以假当真错误D.弃真的错误16.大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A)。
A.标准差B.均值C.统计量分布D.临界值17.大样本二总体成数差进行统计检验时与单样本成数检验相比,主要区别是(A)。
A.标准差B.均值C.统计量分布D.临界值18.如下表所示,求出2×2表中相关强度φ系数为(C)。
A. 1B. 0.3C. 0.5D. 0.419.如下表所示,求出该表中同序对的个数为(B)。
A.310B.624C.524D.31420.两个定序变量之间Gamma系数取值范围为(A)。
A. [-1,1]B. [-∞,0]C. [0,+∞]D. [0,1])A.为测量两个定类变量相关系数,需要在下列哪项功能□前打“√”?(21.AC . . D.B .二、填空题.所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分1 布。
.在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精2岁、岁、1~2度要高一位,例如,原统计资料的年龄以年计算,统计范围为3~46.5~8.5实际分组为岁、4.5~6.5岁、5~6岁、2.5~4.57~8岁等分为四组,岁、0.5~2.5 岁等四组,那么,原统计资料的分组组界称为标明组界。
.统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,3 这样才能构成一份完整的统计表。
、3、、、、、、、4.某村家庭子女数量频次分布:23、14、24、32、12、01、2 3、2 2 。
、、、042,在家庭子女数量这个变量取值中众值是、1在家庭人口数量这个变量、、、、、.某社区六个家庭人口数量分布:5345899 取值中中位值是6.5 。
6.方差与标准差用来度量定距变量的离散程度的测量方法。
.当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随7 机变量的概率分布。
.8.古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率。
9.统计推论的基础是概率论,内容包括两部分:参数估计与假设检验。
10.从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量ξ,1ξ,……,ξ,那么,随机变量ξ,ξ,……,ξ的任何函数f(ξ,ξ,……,22nn211ξ)也是随机变量。
我们把函数f(ξ,ξ,……,ξ)叫作统计量。
n1n 211.根据随机变量的观测值X , X ,……, X计算得到的一切统计数字n21特征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布。
12.原假设(H)又称虚无假设或解消假设,常常是根据已有的资料,或根据0周密考虑后确定的。
13.备择假设(H)又称为研究假设,当经过抽样调查,有充分根据否定原有1假设时,就产生了需要接受其逻辑对立面的假设。
14.假设检验的基本原理是小概率原理。
15.在某个列联表中,只观察其中某一变量的分布,而不管另一个变量的取值,这样就得到边缘分布。
16.协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差。
17.两个定距变量的相关系数r是度量变量间的线性相关程度的,具有PRE性质,r的平方又称为判定系数有着直观的解释意义。
18.方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同。
19.方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率。
20.非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法。
21.非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定,也不是检验总体分布的某些参数,而是检验总体某类有关的性质。
三、判断题(根据题意,表述正确的在后面括号内打“√”,表述错误的在后面)括号内打“×”1.在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况。
(×)2.在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。
(√)3.直方图可以用来反映定类变量的取值状况。
(×)4.直方图与条形图形状相同,没有什么本质区别。
(×)5.中位值比较适用于定距变量。
(×)6.某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。
(×)7.某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠。
(×)8.统计推论是根据局部资料(样本资料)对总体的特征进行推断。
(√)9.“抽样结果与总体参数不一致”是随机现象在推论中所特有的。
(√)2),且方差已知,随着样本容量σn的增加,也10.总体分布为正态分布N(μ,不能减少样本均值抽样分布的分散程度。
(×)11.若总体分布为正态分布,且方差已知,样本均值分布服从t分布。
(×)12.若总体分布为正态分布,大样本均值的极限分布不是N(0,1)。
(×)13.在区间估计中,置信度表示用置信区间估计的可靠性。
(√)14.在区间估计中,显著性水平表示用置信区间估计不可靠的概率。
(√)15.大样本二总体均值差的分布不服从正态分布。
(×)16.大样本二总体成数差的分布不服从正态分布。
(×)2为基础的相关性测量得到C.两个定类变量之间以χ系数具有减少误差比例17性质。
(×)18.两个定类变量之间相关性测量得到λ系数不具有减少误差比例性质。
(×)19.Gamma等级相关的G系数具有减少误差比例的性质。
20.斯皮尔曼等级相关系数r具有减少误差比例的性质。
s四、计算题(要求步骤完整,计算结果正确)1.根据下表2008年某班级Q课程成绩统计分布情况,求某班级Q课程成绩的中位值。
2008年某班级Q课程成绩统计分布情况累计频次频次成绩等级3 3 不及格15 及格 1233 18 中55 良好 22605 优秀2.根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中位值。
某城市抽样调查家庭月收入统计分布情况累计百分累计频次频次家庭月收10 10 10 500及以下30 30 20 500—100065 35 1000—2000 6590 90 —3000 25 2000100 3000及以100 103.下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况:抽样数量社区受教育年限分布状况(年)(个)类别4 10、3A 、5 11、7、6、5B、56、8、10、8根据抽样数据,求出两个社区的平均受教育年限各是多少?相同吗?4.某系大学一年级共550人,Z课程期末考试成绩统计如下表,求该课程的平均分数是多少?某系大学一年级Z课程期末考试成绩统计分布状况学生数量分数15 50 28 6040 63290 70160 7417 80550总和5.针对某村返乡人口状况进行调查,抽取11户大型联合家庭进行调查,各自家庭返乡人口数量分别为:2、2、3、4、4、4、5、5、6、6、7。
求样本中返乡人口数量的四分互差是多少?Q=3答案:6.为了解某种新型奶制品的消费者偏好状况,访问了80个消费者,其中,选择喜欢的有25个,选择一般的有30个,选择不喜欢的有20个,选择无所谓的有5个。
求反映偏好状况的四分互差是什么?答案:有50%的消费者在喜欢与不喜欢之间。
2)。
根据36μ,0.66人的.设某工厂妇女从事家务劳动时间服从正态分布7N (随机抽样调查,每天平均从事家务劳动时间为2.65小时,求μ的双侧置信区间(置信度0.95,Z=1.96,保留小数点后两位)α/2答案:[2.44,2.87] 8.为了对某工厂职工休闲时间进行研究。
根据一次样本(n=33)的调查,平均每天看电视时间为: =0.96小时,S=0.47,试求全厂职工平均每天看电视时间X2,其中)σN95%)。
假定看电视时间服从正态分布(μ,的区间估计(置信度为2σ未知。