当前位置:文档之家› 统计学期末以及考研复习知识点内容详细

统计学期末以及考研复习知识点内容详细

统计学知识点第一章绪论1、今天,“统计”一词有三种含义:⒈统计工作:搜集、整理和分析统计数据的活动。

⒉统计数据:统计工作的成果。

⒊统计学:指导统计工作的理论。

如数理统计学,社会统计学,经济统计学,应用统计学等。

统计三个含义的关系十分密切:统计工作与统计数据是过程与成果的关系;统计工作与统计学是实践与理论的关系。

2、第一部统计学著作是英国人威廉·配第(1623—1687)的《政治算术》(1690)一书。

3、统计学是一门搜集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。

4、统计工作全过程一般可以划分为四个环节:统计设计、统计调查、统计整理、统计分析5.统计的基本方法大量观察法、综合分析法(整理、分析)、归纳推断法(分析)6、统计学与其他学科的关系(一)统计学与数学的关系区别:首先,数学研究抽象的数,统计学则研究具体事物的数量;其次,数学使用纯粹的演绎方法,而统计学则使用演绎与归纳相结合的逻辑方法。

(二)统计学与其他学科的关系凡涉及处理实质性数据的学科都要以统计方法为工具。

可以说,统计学是其他学科的工具。

第二章调查与整理1、目前,数据的计量尺度由粗略(低级)到精确(高级)分为四个层次,即列名尺度、顺序尺度、定距尺度和定比尺度。

1.列名尺度:按照事物的某种属性对其进行平行的分类。

例如,人按性别分为男、女,……。

该尺度的数据不能比较大小、优劣。

2.顺序尺度:对事物之间等级差或顺序差别的一种测度。

例如,考试成绩可分为优、良、中、……。

该尺度的数据能比较优劣,不能进行数学运算。

3.定距尺度:对事物之间等级差或顺序差别较精确地定量测度。

如考试成绩的95 分、86 分、……;天气温度的50C、00C、-50C、……。

该尺度的“0”表示一个水平。

该尺度的数据能进行加、减运算。

4.定比尺度:用来表明数值中存在绝对零点状况下数量特征的描述尺度。

例如,企业利润、产品数量等。

该尺度的“0”表示“没有”或“不存在”。

该尺度的数据能进行加、减、乘、除运算。

2、数据的类型1.定性数据。

也称品质数据,由列名尺度或顺序尺度计量形成,说明事物品质特征,通常用文字描述。

2.定量数据。

也称数量数据,由定距尺度或定比尺度计量形成,说明现象的数量特征,用数值表示。

3、统计指标构成要素:①指标名称;②计量单位;③计算方法;④空间限制;⑤时间限制;⑥指标数值。

4、统计指标的特点:①数量性。

②综合性。

③具体性。

5、标志按其表现形式不同分为数量标志和品质标志;标志按其在总体内是否有变异分为不变标志和可变标志。

6、标志与指标的区别:①标志是说明单位的,指标是说明总体的。

②标志有不用数值表示的品质标志,而指标都是用数值表示的。

7、统计指标按表现形式可分为绝对指标、相对指标和平均指标。

8、总量指标按其反映的内容不同,分为总体单位总量和总体标志总量,简称为单位总量(N)和标志总量(ΣX i)。

9、总量指标按其计量单位不同,分为实物量指标、劳动量指标和价值量指标。

10、统计调查方式。

普查、抽样调查、统计报表、重点调查和典型调查。

11、调查方案设计。

⑴调查目的;⑵调查对象和调查单位;⑶调查项目和调查表;⑷调查方法;⑸调查时间;⑹调查组织与实施。

12、分组原则:①“相斥”原则;②“穷尽”原则。

13、分组作用:①划分现象的类型;②反映总体的结构;③表明现象之间的依存关系。

14、确定实际组限的原则有两个:一是“同组同质原则”;二是“上组限不在内原则”。

15、确定组距的原则有4个:①质别原则(不同质数据分在不同组内);②特征原则(准确显示同质数据的分布特征);③便利原则(为后续工作提供方便);④大量原则(所分的每一组都是一个小总体,因而每组应有若干个数据)。

综合考虑这4个原则,确定组距为5件。

每组起点数值的个位定为0或5。

第三章数据分布特征的描述1、极差也称全距,是一组数据的最大值与最小值之差。

极差计算简单,易于理解。

实践中,常用于工业产品质量的检查和控制。

2.统计表的形式。

统计表由标题、横行、纵栏和统计数字四部分组成。

3.统计表的种类。

统计表按主词的分组情况可分为三种:⑴简单表:主词不分组的统计表。

⑵分组表:主词进行简单分组的统计表。

⑶复合表:主词进行复合分组的统计表。

例如第四章概率与概率分布⒈古典定义:某一事件A发生的概率,是该事件所包含的基本事件数m与基本空间中基本事件总数n的比值。

(客观存在)⒉统计定义:在相同条件下重复进行n次试验,事件A发生m次,随着试验次数n的增大,事件A发生的频率m/n围绕某一常数p 上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概率。

(多次试验)⒊主观定义:人们根据经验和所掌握的有关信息,对事件发生的可能性大小给出的估计值。

(调查研究)4、随机变量的概念。

描述随机现象某一侧面的变量。

5、随机变量的特点。

①取值的随机性;②取值的规律性。

6、大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。

本节只介绍两个最常用的大数定律。

⒈独立同分布大数定律该定律表明,当n足够大时,独立同分布的一系列随机变量的均值接近(依概率收敛于)数学期望,即平均数具有稳定性。

⒉贝努力大数定律该定律表明,当n足够大时,事件A发生的频率接近于事件A发生的概率,即频率具有稳定性。

第五章抽样与抽样估计⒈全集总体。

也叫母体,简称为总体,是指所要认识对象全部单位的集合体,它是由具有某种共同性质的许多单位组成的。

⒉抽样框:包括全部抽样单位的名单框架。

抽样框的形式:①名单抽样框:可供抽取的所有总体单位的名录一览表,如企业名单等;②区域抽样框:按地理位置将总体范围划分为若干小区域,以小区域为抽样单位;③时间表抽样框:把总体的时间过程分为若干个小的时间单位作为抽样单位,如对流水线上24小时内生产的产品进行质量抽查时,以10分钟为一个抽样单位。

3、总体与抽样框的关系:①一致型②包容型4、抽样调查误差包括登记性误差和代表性误差(随机误差、系统误差)5、影响抽样误差的因素⒈总体变异度。

抽样误差与总体标准差(σ)成正比。

⒉样本容量。

抽样误差与样本容量(n)的算术平方根成反比。

⒊抽样方法。

不重复抽样比重复抽样所产生的误差小。

⒋抽样组织。

一般说来,常用抽样组织形式的抽样误差由小到大的顺序是:类型(分层)抽样、机械(等距)抽样、纯随机(简单随机)抽样、整群抽样。

6、抽样平均误差是指所有可能样本估计值与所要估计参数离差的平均数。

7、点估计(一)估计方法也称定值估计,即以样本指标值作为总体指标的估计值.(二)估计量优良的标准⒈无偏性:指一个优良的估计量,其数学期望应等于被估计总体参数的真值。

⒉有效性:指作为优良的估计量,其方差应比较小。

这样才能保证估计量的取值能集中在被估计的总体参数附近。

⒊一致性:指随着样本容量n 的增大,一个好的估计量将在概率意义下愈来愈接近于所要估计的总体参数真值。

8、区间估计:就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。

9、区间估计的依据:⑴样本信息;⑵置信度。

10、抽样设计的原则:1)保证实现抽样的随机性原则。

2)保证实现最大的抽样效果原则。

第六章假设检验1、假设检验的特点⒈采用反证法。

先假设H0是正确的,然后根据抽样理论和样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。

⒉依据“小概率事件在一次试验中不能发生”的原理.即一次抽样调查的结果不是小概率事件。

2、基本抽样组织:3、假设检验的程序。

⑴提出原假;⑵选择检验统计量;⑶规定显著性水平α,确定决策临界值;⑷计算检验统计值,作出决策。

第七章相关与回归分析1、相关关系。

当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。

变量间的这种相互关系,称为具有不确定性的相关关系。

2、可决系数与相关系数⒈相关系数与可决系数的联系相关系数(r)的平方等于回归模型的可决系数(r2)。

⒉相关系数与可决系数的区别⑴说明的内容不同:相关系数说明变量之间线性关系的紧密程度;可决系数说明回归模型的拟合程度。

⑵取值范围不同:-1≤r≤1;0≤r2≤1a —因变量的基础水平;b —自变量增加一个单位时,因变量平均变动的数值.3、经检验,自变量对因变量影响显著时,就可用于预测。

当xf 值在样本之内时,称为内插预测或事后预测;当xf 值在样本之外时,称为外推预测或事前预测。

4、预测误差的来源。

⑴模型本身的误差;⑵回归系数估计值的误差;⑶自变量取值偏离样本所造成的误差;⑷未来时期总体回归系数发生变化所造成的误差。

第八章时间数列分析1、时间数列由两个基本要素构成:一是资料所属的时间(时序);另一个是各时间上的统计指标数值(数列)。

2、分析时间数列的目的:一是研究事物的发展状况;二是分析现象的发展趋势;三是揭示事物的演变规律;四是为了预测事物在未来时间上的数量。

3、时间数列按其指标表现形式不同分为绝对数~、相对数~和平均数~三种。

4、间隔:时点数列中两数值的时点间距。

5、相对数~和平均数~的共同特点是:它们都由绝对数时间数列派生而得;它们的指标数值具有不可加性。

6、编制时间数列的原则:基本原则:保证数列中各数值的可比性。

7、平均发展水平和静态平均数的区别:8、平均发展水平的计算:1.累计增长量与逐期增长量的关系:连续的逐期增减量之和等于累计增减量。

2.定基发展速度与环比发展速度的关系:环比发展速度的连乘积等于定基发展速度。

9、.平均发展速度的计算。

①时点数列。

采用水平法。

②时期数列。

当现象较稳定地增长(或下降)时,采用水平法;当现象呈升降交替地发展时,应采用累计法。

10、增长百分之一的绝对值:上期水平的百分之一。

11、长期趋势模型的选择。

如果时间数列逐期增长量相对稳定,选用直线模型;如果现象的二级增长量大体相同,选用抛物线模型;如果环比速度序列基本一致,选用指数曲线模型。

相关主题