社会统计学复习题一、名词解释1、社会统计学2、中位数3、众数4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。
5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。
6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。
7、消减误差比例:变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。
将削减误差比例记为PRE 。
8、因果关系:变量之间的关系满足三个条件,才能断定是因果关系。
1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。
9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。
10、散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。
11、同序对:在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。
12、异序对:在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。
13、大数定理:当我们的观察次数n 趋向无限时,随机事件可能转换为不可能事件或必然事件。
即,在大量观察的前提下,观察结果具有稳定性。
二、选择题6.下面能进行除法运算的测量尺度是()A 定比尺度B 定类尺度C 定距尺度D 定序尺度7.教育程度是()的测量。
A 定比尺度B 定类尺度C 定距尺度D 定序尺度8.智商是()的测量。
A 定比尺度B 定类尺度C 定距尺度D 定序尺度9.籍贯是()的测量A 定比尺度B 定类尺度C 定距尺度D 定序尺度10.在社会统计学中,()是反映集中趋势最常用、最基本的平均指标。
A 中位数B算术平均数 C 众数D几何平均数11.关于学生t分布,下面哪种说法不正确( B )。
A 要求随机样本B 适用于任何形式的总体分布C 可用于小样本D 可用样本标准差S代替总体标准差σ12.在统计检验中,那些不大可能的结果称为( D )。
如果这类结果真的发生了,我们将否定假设。
A 检验统计量B 显著性水平C 零假设D 否定域13.在用样本指标推断总体指标时,把握程度越高则( B )。
A 误差范围越小B 误差范围越大C 抽样平均误差越小D 抽样平均误差越大14.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在( A )关系。
A 直线正相关B 直线负相关C 曲线正相关D 曲线负相关15.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。
A 无相关B 低度相关C 中等相关D 高度相关17.关于相关系数,下面不正确的描述是( B )。
≤r1时,表示两变量不完全相关;A当0≤B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。
18.欲以图形显示两变量X和Y的关系,最好创建( D )。
A 直方图B 圆形图C 柱形图D 散点图19.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。
A 0.50B 0.80C 0.64D 0.9020.在完成了构造与评价一个回归模型后,我们可以( D )。
A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值21.两变量的线性相关系数为0,表明两变量之间( D )。
A 完全相关B 无关系C 不完全相关D 不存在线性相关23.在相关分析中,对两个变量的要求是( A )。
A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数24.在回归分析中,两个变量( D )。
A 都是随机变量B 都不是随机变量C 自变量是随机变量D 因变量是随机变量25.一元线性回归模型和多元线性回归模型的区别在于只有一个( B )。
A 因变量B 自变量C 相关系数D 判定系数26.以下指标恒为正的是( D )。
A 相关系数rB 截距aC 斜率bD 复相关系数27.下列关系中,属于正相关关系得是( A )。
A 身高与体重B 产品与单位成本C 正常商品的价格和需求量D 商品的零售额和流通费率28、下列变量中属于定序变量的是()A、门牌号B、学生学号C、职称等级D、身高29、用具有频数最多的变量值来表示变量的集中值被称为()A、众值B、中位值C、均值D、四分位差30、标准差数值越小,则反映变量值( )A、越分散,平均数代表性越低B、越集中,平均数代表性越高C、越分散,平均数代表性越高D、越集中,平均数代表性越低31、下面不属于正态分布图特征的是()A、有一条对称轴B、有一条渐近线C、有一个顶点D、有2个单位的面积。
32、直方图具备的特征是()A、高度代表频次B、宽度代表频次C、面积代表频次D、各分段组可以分开33、采用回置法,从一副52张扑克牌里抽取两次,抽中两张红桃的概率为()A、1/52B、1/16C、1/13D、1/434、下列属于定类层次相关分析法的是()A、斯皮尔曼系数B、Lambda系数C、Gamma系数D、eta系数35、当样本量n=25时,我们对其进行均值检验时,应该选用()方法进行。
A、Z检验B、F检验C、T检验D、上述三者都可以36、如果,X i>X j,Y i<Y j,那么,就称被调查者i和j这一配对为()。
A、异序对B、同序对C、X的同分对D、Y的同分对37、一般认为:积差系数r值等于0.3为()。
A、完全相关B、高度相关C、中等相关D、无相关38、下列变量中不属于定类变量的是()。
A、车牌号B、手机号C、学历D、性别39、数列2、3、5、1、7、9、2的中位值是()。
A、5B、3C、2D、140、两个正态分布分别为:N(1,25)和N(5,36),将两个正态分布作图,下列说法错误的是()。
A、前者图形的顶端更细小B、前者图形更靠左C、后者图形的顶端更细小D、后者图形更靠右41、直方图里,频次由()来表示。
A、面积B、高度C、宽度D、组距42、从一副52张的扑克牌中抽一张牌,抽到一张红桃或者方块的概率是()。
A、1/5B、1/4C、1/3D、1/243、下列属于定类层次相关分析法的是()A、斯皮尔曼系数B、Lambda系数C、Gamma系数D、eta系数44、从某公司抽取200名员工作为样本进行调查,进行推论分析时,除了()外,其他三个都是我们采用Z检验法的原因。
A、样本容量数符合小样本要求B、总体符合正态分布C、满足大数定理要求D、样本容量达到大样本要求。
45、如果,X i>X j,Y i>Y j,那么,就称被调查者i和j这一配对为()。
A、异序对B、同序对C、X的同分对D、Y的同分对46、区间估计里,置信区间内的置信度大小为()。
A、αB、βC、1-αD、1-β47、简单线性回归分析中,两变量的层次分别为()A、定类—定类B、定类—定序C、定序—定距D、定距—定距三、填空题1.()和中心极限定理为抽样推断提供了主要理论依据。
2.抽样推断中,判断一个样本估计量是否优良的标准是(无偏性)、(一致性)、(有效性)。
3.在一副扑克牌中单独抽取一次,抽到一张红桃或K的概率是(1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃K的概率是(1/52 )。
5.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于(正态)分布。
6.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平),它决定了否定域的大小。
7.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(大),原假设为真而被拒绝的概率越(小)。
8.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和(区间估计)。
9.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
10.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)Y是服从();实际观察值Y围绕每个估计值c11.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。
这种分析方法,通常又称为(回归分析)12、变量层次一般分为、、和。
13、统计按其内容主要包括两个方面:分析和分析。
14、定类层次主要的集中趋势法是,定序层次主要的离散趋势法是。
15、统计推论分为参数估计和,其中参数估计又分为和。
16、置信区间与可信度之间是成关系,即估计的区间越大,则可信度也就越。
17、根据样本计算出来的一切统计数字特征值被称为,总体值称为。
18、众数运用层次变量的集中趋势分析,中位数用于层次变量的集中趋势分析,均值用于定距层次变量的分析,标准差用于定距层次变量的分析。
19、正态分布图的形状和位置主要由和决定。
20、测量两个变量的相关系数时,首先考虑的是变量的,其次考虑变量间是否对称,最后最好选用具备意义的相关系数。
21、以样本的统计值来估计总体的参数值,有两大类做法,一类是,另一类是,二者均要求样本是以方法抽取的。
22、某一孕妇生男生女纯属偶然现象,但全市出生的婴儿性别比例一直维持在50%左右,这种现象称为定理。
23、假设检验时,首先需要做出假设和被择假设,并以假设为基础进行数据推导,如果我们的统计检验值落在,我们就应该接受被择假设。
三、判断题1.社会统计描述,即通过部分研究对象的统计资料对研究对象的总体的性质进行推论与归纳。
()2.推论统计需要的统计资料相对而言较少,所以在人力、物力及时间等方面比较经济,研究和应用的范围也拓宽了许多。
()3.无论分布曲线是正偏还是负偏,中位数都居算术平均数和众数之间。
()4.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。
(√)5.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。
(√)6.检验的显著性水平(用α表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。