2014统计学复习参考题复习要求:1、全面复习,认真阅读和熟悉教材内容;2、把握基本理论和方法,定性与定量结合。
3、结合作业复习。
特别提醒:考试请带计算器。
第一章导论1、统计学的含义?数据分析方法的分类?2、统计数据的分类及其各自的特点?3、统计中的基本概念?第二章统计数据的收集1、概率抽样与非概率抽样的含义、区别与特点?2、2、概率抽样与非概率抽样的类型?3、简述典型调查与抽样调查的比较?4、抽样误差的含义及其影响因素?5、非抽样误差的类型?6、误差的控制?第三章统计数据的整理与显示1、数据预处理的内容?2、品质型数据的整理与图示各有哪些?3、数值型数据的整理与图示各有哪些?4、展示数据的两种主要方式?5、数据分组、频数分布表与直方图的制作?第四章数据的概括性度量1、数据分布特征的测度?2、简述众数、中位数和平均数的特点与应用场合?3、简述异众比率、四分位差、方差和标准差的应用场合?4、众数、中位数、平均数和方差、标准差、离散系数的计算?第五章统计指数(教材第14章)1、指数及其分类?2、总指数的分类与编制方法?加权综合指数与加权平均指数的区别、联系与计算?3、什么是同度量因素?它有什么作用?4、指数体系与两因素分析?总量指数体系分析与平均数变动因素分解?第六章统计量及其抽样分布(并参考教材第五章)1、参数与统计量?抽样分布与长用的几个重要分布?2、总体分布与抽样分布的关系3、一般正态分布与标准总体分布的转换与总体分布表的使用?4、样本均值与样本比例的抽样分布特征及相关计算?5、两个样本平均值之差的分布特征与相关计算?第七章参数估计?1、参数估计及方法?点估计和区间估计的区别?2、简述样本量与置信水平、总体方差、估计误差的关系?3、评价一个估计量好坏的标准有哪些?4、一个总体的参数的区间估计及所使用的分布?区间估计的计算?5、估计总体平均值与总体比例时的样本量的计算?6、影响抽样误差大小的因素?第八章假设检验1、参数估计与假设检验的的比较?2、假设的表达式、流程与两类错误?3、检验统计量的确定?4、总体平均值的检验与计算?5、总体比例的检验与计算?6、总体方差的检验与计算?7、检验结果的解释与单侧检验中假设的建立?第九章一元线性回归(教材第11章)1、什么是相关分析与回归分析?相关分析与回归分析的联系与区别?2、相关系数的含义与计算?2、一元线性回归模型与参数估计?判定系数与估计标准误差的计算?方程的显著性检验?3、利用回归方程进行预测的步骤与计算?第十章时间序列分析与预测(教材:第13章)1、时间序列及其构成?2、增长率分析与计算?3、时间序列预测的程序?4、线性趋势预测?5、季节指数预测方法与计算?第十一章方差分析(教材:第10章)1、方差分析及有关术语?2、方差分析的基本思想和原理?3、方差分析的基本步骤?4、单因素方差分析?简答题供参考:1、统计数据分为哪几种类型?各有什么特点?答:1、分类数据。
将数字作为现象总体中不同类别或不同组别的代码,这是最低层次的尺度。
在这种情况下,不同的数字仅表示不同类(组)别的品质差别,而不表示它们之间量的顺序或量的大小。
2、顺序尺度不但可以用数表示量的不同类(组)别,而且也反映量的大小顺序关系,从而可以列出各单位、各类(组)的次序。
以上两类数据说明的是事物的品质特征,不能用数据表示,其结果均表现为类别,也称为定性数据或品质数据(Oualitative data );3、数值型数据。
说明的是现象的数量特征,能够用数值来表现,因此也称为定量数据(Quantitative data )。
可进行加、减、乘、除运算。
适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。
适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据2、概率抽样与非概率抽样的含义与特点?答:非概率抽样就是调查者根据自己的方便或主观判断抽取样本的方法。
由于非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
如果调查的目标是用样本的调查结果对总体的相应参数进行评估,并计算估计的误差,得到的总体参数的置信区间,这时就不适合采用非概率抽样。
非概率抽样的特点是操作简单、时效快、成本低,而且对于抽样中的统计专业技术要求不高。
非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数据分析提供准备。
概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所需要的样本量。
所以,如果调查的目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间,就应当使用使用概率抽样的方法。
当然,概率抽样的技术含量更高,无论是抽样样本还是对调查数据进行的分析,都要求有较高的统计学专业知识,调查的成本也比非概率抽样的调查成本高。
概率抽样这一方法是根据一个已知的概率选取被调查者,无须调查人员在选样中判断或抽选。
从理论上讲,概率抽样是最理想、最科学的抽样方法,它能保证样本数据对总体参数的代表性,而且它能够将调查误差中的抽样误差限制在一定范围之内。
但相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。
概率抽样有以下几种形式。
1.简单随机抽样分层抽样整群抽样等距抽样非概率抽样不是完全按随机原则选取样本。
非概率抽样有三种形式。
1.主要是由调查人员自由选择被调查者的非随机选样2.通过某些条件过滤选择某些被调查者参与调查的判断抽样法。
只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法。
3、简述众数、中位数和平均数的特点与应用场合?答:算术平均数与众数、中位数的关系取决于频数分布的状况。
它们的关系如下:1. 当数据具有单一众数且频数分布对称时,算术平均数与众数、中位数三者完全相等,即0e X M M ==,这一关系如图3.1所示。
2.当频数分布呈现右偏态时,说明数据存在最大值,必然拉动算术平均数向极大值一方靠,则三者之间的关系为X >e M >0M ,这一关系如图3.2。
3. 当频数分布呈现左偏态时,说明数据存在最小值,必然拉动算术平均数向极小值一方靠,而众数和中位数由于是位置平均数,不受极值的影响,因此,三者之间的关系为X <e M <0M ,这一关系如图3.3。
从上面的分析我们可以看出,当频数分布出现偏态时,极端值对算术平均数产生很大的影响,而对众数、中位数没有影响,此时,用众数、中位数作为一组数据的中心值比算术平均数有较高的代表性。
算术平均数与众数、中位数如果从数值上的关系看,当频数分布的偏斜程度不是很大时,无论是左偏还是右偏,众数与中位数的距离约为算术平均数与中位数的距离的两倍,即︱e o M M -︳=2︱e X M -︳ (3.18)根据上述关系,可以得出: 3()32o e e M X X M M X =--=- (3.19)对于一组数据,在已知两个代表值的情况下,可根据上式推算出另一代表值。
4、参数估计与假设检验的异同?答:它们都是利用样本对总体进行推断,但是推断的角度不同。
参数估计问题专门研究由样本估计总体的未知分布或分布中的未知参数,当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
假设检验,则是对检验的参数提出一个假设,然后利用样本信息去检验这个假设是否成立。
5、方差分析的基本思想?答:方差分析是分析试验数据的一种重要统计方法。
方差分析法就是利用方差的可分解性,从总变异中分解出组间(条件)变异和组内(误差)变异,并把组间变异与组内变异进行对比,从中找出影响试验结果的主要因素。
具体地说就是首先假设所有数据都来自同一正态总体;然后检验这种假设是否正确。
6、相关分析与回归分析的联系与区别?答:联系:(1)先进行相关分析再进行回归分析,只有在确定两变量存在着相关分析后,才能分析两变量的回归分析。
两变量间的相关程度越大,研究回归才更有意义。
通过相关分析,可以大致判断现象与现象之间配合什么数学模型建立回归方程。
区别:分析的目的不同,相关分析主要分析变量之间有无关系,使什么样的关系,有多大程度的关系;回归分析用于构建有联系的变量间的回归模型,用于推理变量之间的因果关系。
相关分析的两个或两个以上的变量是随机变量。
回归分析中的自变量是确定性的变量。
7、简述影响抽样误差大小的因素答:(1)总体各单位标志值的差异程度。
在其他条件不变的情况下,总体各单位标志值的差异程度越大,抽样误差越大,反之,越小。
(2)样本单位数的多少。
在其他的情况不变时,样本单位越多,抽样误差越小,反之,越大。
(3)抽样方法。
抽样方法不同,抽样误差不同。
重复抽样比不重复抽样误差大。
(4)抽样的组织形式,抽样的组织形式不同,抽样的误差不同。
1、品质数据与数值型数据的整理与图示各有哪些?答:对品质数据主要是做分类整理,对数值型数据则主要是做分组整理。
定类数据本身就是对事物的一种分类,因此,在整理时除了要列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。
用频数分布表示反映分类数据的频数分布。
如果用图形来显示频数分布,就会更加形象和直观。
其中包括条形图和圆形图。
还可以绘制环形图。
对于定序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积频率(百分比)。
定序数据的图示根据累积频数或累积频率,可以绘制累积频数或频率分布图环形图。
定类数据和定序数据的整理与图示方法,也都适用于对数值型数据的整理与显示。
但数值型数据还有一些特定的整理和图示方法,并不适用于品质数据。
在整理时通常要进行数据分组分组后再计算出各组中出现的次数或频数,就形成了一张频数分布表。
分组的方法有单变量值分组和组距分组两种。
介绍的条形图、圆形图、环形图及累积分布图等都适用于显示定距数据和定比数据。
此外,对定距数据和定比数据还有以下一些图示方法,这些方法并不适用于定类数据和定序数据。
分组数据——直方图和折线图未分组数据——茎叶图)时间序列数据——线图统计表既是调查整理的工具,又是分析研究的工具,2、简述异众比率、四分位差、方差和标准差的应用场合?答:异众比率的作用是衡量众数对一组数据的代表性程度的指标。
异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好。
异众比率主要用于测度分类数据的离散程度,当然,对于顺序数据也可以计算异众比率。
四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。