当前位置:文档之家› 统计学期末复习重点

统计学期末复习重点

1.统计主体:是统计所要研究对象的全体,是由客观存在的、具有某种共同性质的许多个别事物构成的整体总体单位:构成总体的每一个个别事物总体容量:总体中总体单位的数量(定义及相关联系)2.标志:总体各单位所共同具有的属性或特征标志表现:总体单位个标志的具体体现及其分类(品质,数量;可变性)可变标志可以视为变量(定义及其相关关系3.指标:概念:统计活动按照一定的统计方法,对总体单位数、总体各单位的标志表现进行记录、核算、汇总、综合而形成的,用于反映统计总体某一综合数量特征的科学范畴、特征:数量性,综合性,具体性六要素:指标概念,指标数值,计算方法,计算单位,时间规定性,空间规定性分类(质量(相对数)、数量(绝对数)、时期、时点:)4.指标、标志的区别联系:统计指标说明的是总体数量特征,而标志是说明总体单位特征的名称;指标都可以用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志;统计指标是对总体单位数、总体单位标志表现经过一定处理后得到的5.描述性统计:是研究如何取得反映客观现象的数据,并将收集的数据进行加工处理,通过表格、图形或数值形式显示,进而通过综合、概括与分析得出反映客观现象总体的数量特征、数量关系和数量规律推断统计:是主要研究如何根据样本数据来推断总体的数量特征。

主要包括参数估计的方法、假设检验的方法、方差分析的方法、相关与回归分析的方法等(了解)第二章1.数据的测量值(将尽量尺度从低级到高级、由粗略到精确分为定类,定序,定距,定比)2.统计调查方式(报表:全面调查、全面报表、定期普查:普查是为了某种特定目的而专门组织的一次性的全面调查特点:一次性或周期性;需要规定统一的标准调查时间;数据比较准确;范围比较狭窄、抽样:是对样本单位进行调查的一种专门组织的非全面调查。

有随机抽样和非随机抽样两种随机抽样:按随机原则从统计总体中抽取部分的单位进行实际调查,并根据样本信息对总体数量特征做出具有一定可靠程度的判断重点调查:是了解基本情况的非全面调查典型调查:是根据调查目的和要求,有意识地选择有代表性的单位,进行深入调查的方法)(基本概念,特点)3.抽样调查:(调查对象:、时间、期限)*4. 抽样调查的类别(随机调查,非随机调查)(重点调查,典型调查)第三章数据分组:数据分组的关键是分组标志的选择数据分组中:1.分配数列的概率及要素:概念:将总体中的所有单位按有一定标志分组整理,并将各组按一定顺序排列,形成总体中各个单位在各组间的分布,称为分配数列或次数分配要素:由总体分组和各组相对应的分配次数两个要素构成反映总体中所有单位在各组间的分布状况和分布特征数量型数据分配数列:确定组数:近似组数=1+3.322lgn确定组距:近似组距=(数据最大值-数据最小值)÷组数=全距÷组数 频数密度=频数÷组距累积频数是小于或等于每一组上限的数据项个数累积频数是小于或等于每一组上限的数据项的百分数2. 统计指标的分类(总量、平均、相对)概念:通过各种尺度计量而成的统计数据,经过统计整理,形成能够反映总体某些数量特征的规范有序的数据总量指标:反映总体单位总数或者某种标志的总量,根据这个可以分为总体单位总量和总体标志总量也可以按照反映的时间状况不同,分为时期总量(是社会经济现象在一段时期内发展变化的总量指标)和时点总量(是社会经济现象在某一时刻的状态的总量指标)平均指标是概括地反映现象的一般水平的综合指标。

静态平均指标=总量÷单位数相对指标:两个互有联系的指标对比所得的结果就是相对指标,反映现象之间的数量关系 计划完成程度指标(计算);结构相对指标;比例相对指标;比较相对指标;强度相对指标;动态相对指标(计算)3. 统计图表(了解)茎叶、饼、柱、散点图第四章1. 集中趋势(众数、中位数、平均数*(大题)的概念及计算)众数:是一组数据中出现频数最多的变量。

一般情况下,只有在数据量较大时,众数才有意义 (在频数分布图怎么计算众数:d 211⨯∆+∆∆+L ,L 是众数所在组的下限,得他1是众数组与前一组频数之差,得他2是与后一组之差,d 表示众数组组距)中位数:一组数据排序后处于中间位置上的变量值。

算术平均数:是一组数据相加后除以数据的个数。

调和平均数:又称“倒数平均数”,是各变量值的倒数的算术平均数的倒数几何平均数:是n 个变量值的连乘积的n 次方根(平均发展速度和平均增长速度,平均本利率和平均年利率)2. 离中趋势(方差、标准差、离散(变异)系数)异众比率:非众数组的频数占总频数的比率平均差:各变量值减去平均数的绝对值的和再除以变量数*方差:样本方差S 2,1)(1--∑=n x x n i i,总体方差σ2,N∑=n 1i i -x )(μ(μ总体平均数,N 总体频数 *标准差:样本方差S ,总体方差σ,方差的开方*离散系数:又称变异系数,是各变量数据的离散程度与其平均数的比值,比如标准差系数就是标准差比平均值的百分数。

是用来消除变量值水平的高低和计量单位的不同对离散程度度量值的影响。

比如比较成人和儿童平均身高时偏度系数,峰度系数(应该不考)第五章抽样调查:按随机原则从总体中抽取一部分单位进行调查,用调查所得的数值对总体数量特征做出推断的一种统计调查方法。

抽样调查是现代推断统计的核心。

遵循随机原则,机会均等原则1. 总体样本,参数,统计量,基本概念总体是根据研究目的确定的所要研究的事物的全体。

组成总体的个别事物是总体单位。

样本是按照随机原则从总体中抽取的部分单位组成的集合参数是根据总体各单位的标志值或标志表现计算的反映总体数量特征的综合指标,是抽样推断的对象统计量是根据样本各单位标志值或标志表现计算的样本指标重复抽样和不重复抽样(不重要)2. 抽样方式(等距,分层,随机,抽样框)抽样设计基本原则:抽样随机原则;最大效果原则分层抽样:先按一定标志将总体各单位进行分类,然后分别从每一类中按随机原则抽取一定单位作为构成样本等距抽样:先按某种标志对总体各单位进行顺序排列,然后按固定间隔抽取样本单位整群抽样,将总体分为若干群,然后从中随机抽取部分群,对选中群的所有单位进行全面调查阶段抽样:在抽样时先抽总体中某种更大范围的单位,再从选的大单位中抽较小范围的单位,逐次类推,直至抽选出样本的基本单位,分阶段来完成抽样的组织工作非概率抽样:方便抽样,判断抽样3. 抽样方式(理解参数区间估计基础)当样本容量足够大时(n>=30),就可以看成是正太分布:从均值为μ,方差为σ2的总体,抽取容量为n 的样本,样本均值x 的抽样分布近似服从均值为μ,方差为σ2/n 的正态分布(重复抽样时,或无限总体不重复抽样时,或N 很大,而n 很小时)因为不重复抽样时,样本均值方差是)(很大时,可以简化成)(N N N n N n -1n 1n 22σσ--4. 参数区间估计(大题)*应该是考总体均值样本容量的确定第六章1. 第一类二类错误概念第一类错误:当原假设为真时拒绝原假设,又称为弃真错误第二类错误:当原假设为假时没有拒绝原假设,又称为取伪错误(犯第一类错误的概率是可以人为控制的)2. 显著性水平概念发生第一类错误的概率常被用于检验结论的可靠性度量,假设检验中犯第一类错误的概率被称为显著性水平显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率3. 计算判断是否接受原假设(大题)*第八章1. 相关关系的种类相关关系是指现象之间客观存在的非确定性的数量依存关系(1)按相关关系涉及的变量或因素的个数,可以分为单相关和复相关(2)按相关关系的表现形式,可以分为线性相关和非线性相关(3)按相关关系的方向,可以分为正相关和负相关(4)按相关关系的程度,可分为完全相关、不完全相关和不相关相关分析的意义:可以确定变量之间相关关系的方向和程度;相关分析可以衡量回归估计的精确程度2. 相关关系,因果关系,回归关系的联系和区别联系:相关分析和回归分析有共同的研究对象;相关关系和回归分析需要相互补充;相关分析是回归分析的前提;回归分析是相关分析的拓展区别:变量的地位不同(相关分析中变量处于平等地位,回归分析中变量不平等,区分自变量和因变量);变量性质不同(相关分析中变量都是随机变量,回归分析中,因变量是随机变量,自变量假定为非随机变量);研究目的不同(相关分析研究变量间的相关关系的密切程度和方向,回归分析研究相关关系的集体形式);研究方法不同(相关分析通过相关表、相关图和相关系数研究,回归分析通过回归模型研究);作用不同(相关分析只能描述变量间相关关系的程度和方向,而回归分析可以揭示自变量对因变量的影响大小,并进行预测)相关关系和因果关系之间的区别两个变量之间存在相关关系,不一定说明两者之间存在着因果关系。

因果关系,是指一个变量的存在一定会导致另一个变量的产生。

而相关性是统计学上的一个概念,是指一个变量变化的同时,另一个因素也会伴随发生变化,但不能确定一个变量变化是不是另一个变量变化的原因。

比如天气冷和下雪通常一起发生,说明两者有很强的相关性,但不能肯定是谁导致了谁,所以不确定两者是够有因果关系。

相关关系和回归关系的关系联系:1.无相关就无回归,相关程度越高,回归方程的拟合程度就越好;2.相关系数和回归系数的方向一致,可以相互推算。

区别:1.相关分析中x和y对等,回归分析中x和y要确定自变量和因变量;2.相关分析中x、y均为随机变量,回归分析中只有因变量为随机变量;3.相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。

————————————————3.回归方程中变量、参数的经济与统计含义第九章时间序列:是统计数据按时间先后顺序排列而形成的一种数列。

可以反映现象变化发展的过程和特点基本要素:时间要素;观察值要素种类:绝对数时间序列(时期序列,时点序列),相对数时间序列,平均数时间序列编制原则:时期长短相等原则,总体范围一致原则,计量方式一致原则,指标内容一致原则1.同比、环比的概念及计算发展水平就是时间数列中每一项指标值平均发展水平(在计算间隔相等时点序列的平均数时,首位二分之一相加,除n-1.间隔不相等要计算权数)相对数时间序列计算平均数,是分子分母分别求平均值再相比增长量,累积增长量,逐期增长量,平均增长量(累积增长量/n-1)发展速度(报告期/基期)(同比)定基发展速度(报告期/固定基期)环比发展速度(报告期/上一期)定基发展速度=环比发展速度的连乘积增长速度(增长量/基期)平均发展速度(环比发展速度的连乘积开n次方)2.季节指数的概念时间序列=长期趋势成分、季节变动成分、循环变动成分与不规则变动成分的和或积季节指数(比率)=同月(季)平均数/全年总平均数季节指数表明各月(季)比权年总水平高或低的程度,反映季节变动的一半趋势季节变差=同月(季)平均数-全年总平均数3.如何消除季节比(计算季节比)*校正系数=1200%/月季节指数之和,或=400%/季季节指数之和校正值=季节变差之和/12(4)季节指数(校正后)=原指数*校正系数季节变差(校正后)=原变差+校正值预测值=上年月平均值*要预测的那个月的指数第十章1.总指数的概念与分类总指数是说明多种事物或现象在不同时期上的综合变动过程指数分个体和总;简单和加权;数量指标和质量指标;静态和动态2.同度量因素、指数化因素概念把不能直接相加的不同度量的指标过渡到可以相加的同度量的指标所需引入的媒介因素叫同度量因素考察的随时间变化的因素指标称为指数化因素3.计算指数假设检验:考两题1.备择假设原价设3.拒绝原假设含义总体均值考大样本(N>30,正态分布)可直接用样本标准差。

相关主题