统计学的复习提要第一章数据与统计一、统计统计的三种含义:统计活动(统计工作)、统计数据(统计资料)和统计学。
二、数据1、统计数据的四种计量尺度定类尺度、定序尺度、定距尺度和定比尺度2、数据类型(依据四种不同的计量尺度分为)分类数据、顺序数据、数值型数据3、常用的统计调查组织方式:(1)普查:为某一特定的目的而专门组织的一次性全面调查方式。
(2)抽样调查:从总体中抽取样本进行调查,利用样本调查的结果对总体的特征进行推断的一种非全面调查方式。
(3)统计报表:按照规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。
(4)重点调查:从总体中选择少数重点单位进行调查的调查组织方式。
(5)典型调查:从总体中选择一个或几个代表性的单位深入细致调查的一种调查组织方式。
----------专业最好文档,专业为你服务,急你所急,供你所需-------------第二章描述统计一、定性数据的图表分析1、频数分布(1)频数和频率(2)频数分布2、图形表示主要有条形图、饼图和环形图等。
二、定量数据的图表分析1、定量数据分组(1)单变量分组单变量分组是把一个变量值作为一组,这种方法一般适用于离散型变量且数目较少的情况。
(2)组距分组组距分组是将全部变量值依次划分为若干个数值区间,每一个数值区间作为一组,这种方法一般适用于离散型变量变量值较多或者连续型变量。
注意:分组过程中,为解决“不重”问题,采用“上限不在内”的原则;对于开口组,如何确定首组的下限和末组的上限?以及如何计算组中值?2、图形表示----------专业最好文档,专业为你服务,急你所急,供你所需-------------主要有直方图、折线图、茎叶图和箱线图、散点图。
第三章描述统计:数值方法一、集中趋势测度重点会计算各种刻画集中趋势的测度值。
)算术平均数1、平均数(适用于数值型数据2、众数(1)一组数据中出现次数最多的变量值(2)不受极端值的影响(3)一组数据可能没有众数或有几个众数(4)不仅适用于数值型数据也适用于分类数据和顺序数据注意:对于组距分组数据,如何计算众数?3、中位数(1)排序后处于中间位置上的值(2)不受极端值的影响(3)主要用于顺序数据,也可用数值型数据,但不能用于分类数据----------专业最好文档,专业为你服务,急你所急,供你所需-----------------------专业最好文档,专业为你服务,急你所急,供你所需-------------注意:如何计算中位数?4、 四分位数如何计算1/4四分位数和3/4四分位数?5、 均值、众数和中位数的关系(1)对称 (2)左偏分布 (3)右偏分布二、 离散趋势测度重点会计算各种刻画离中趋势的测度值。
1、 全距一组数据的最大值与最小值之差R = max(xi ) - min(xi )2、内距(四分位数差)上四分位数与下四分位数之差。
3、方差与标准差重点计算总体方差与标准差和样本的方差与标准差。
(未分组数据和分组数据)4、标准分数数据标准化σμ-=x Z5、离散系数(标准差系数)(1)什么是离散系数?标准差与均值的比值。
(2)为什么计算离散系数?三、分布形态的度量----------专业最好文档,专业为你服务,急你所急,供你所需-------------1、分布的对称性偏态:数据分布的不对称性。
2、分布的陡峭性峰度:数据分布的平峰或尖峰程度。
第四章抽样及抽样分布一、六种常用抽样技术简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样以及不等概率抽样二、抽样分布1、样本均值的抽样分布(1)当总体服从正态分布时,来自该总体的所有容量为n 的样本的均值⎺x 也服从正态分布,⎺x 的数学期望为μ,方差为σ2/n 。
即⎺ (2)设从均值为μ,方差为σ 2的一个任意总体中抽取容量为n 的样本,当n 充分大时(n ≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布2当样本容量n 足够大时(即np ≥10,n(1-p) ≥10),样本比),(~2σμN X ),(~2n N X σμ例p 近似服从均值为π 、方差为π(1-π)/n 的正态分布。
3、样本方差的抽样分布当总体 ,从中抽取容量为n 的样本,则 )1(~)1(222--n S n χσ第五章 参数估计一、 两种参数估计1、 点估计:用样本估计量的某个值直接作为总体参数的估计值。
2、 区间估计(置信区间,可靠性)3、 评价点估计量的标准无偏性 有效性 一致性:二、一个总体参数的区间估计1、总体均值的区间估计(1)总体服从正态分布,且方差(σ2) 已知2),(~2σμN X αθθθ-=≤≤1)ˆˆ(U L P 。
的概率为包含待估参数随机区间αθθθ-1]ˆ,ˆ[U L x(2)总体服从正态分布,且方差(σ2) 未知(3)非正态总体均值的区间估计(大样本)2、总体比例的区间估计3、总体方差的区间估计----------专业最好文档,专业为你服务,急你所急,供你所需-------------三、样本容量的确定1、估计总体均值时样本容量的确定2、估计总体比例时样本容量的确定第六章假设检验一、假设检验的基本问题1、什么是第一类和第二类错误?2、双侧检验、右侧检验和左边检验二、一个总体参数的检验1、总体均值的检验2、总体比例的检验3、总体方差的检验第八章相关与回归分析一、相关分析----------专业最好文档,专业为你服务,急你所急,供你所需-----------------------专业最好文档,专业为你服务,急你所急,供你所需-------------1、相关关系的定义2、相关关系的类型3、相关系数的性质二、一元线性回归1、一元线性回归模型εββ++=X Y 10误差项是不可测随机变量,假定服从期望为0,方差为Q2的正态分布。
反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响(反映未列入方程式的其他各种因素对Y 的影响)。
主要来自以下几个方面:(1)自变量的省略(2) 统计误差(3) 模型的设定误差(4) 随机误差2、估计10ˆ,ˆββ(最小二乘法的思想)(1) 1111221101ˆˆˆn n n i i i i i i i n n i i i i n x y x y n x x y x βββ=====⎧⎛⎫⎛⎫-⎪ ⎪⎪⎝⎭⎝⎭⎪=⎪⎛⎫⎨- ⎪⎪⎝⎭⎪⎪=-⎩∑∑∑∑∑----------专业最好文档,专业为你服务,急你所急,供你所需-------------(2)回归方程x y 10ˆˆˆββ+=β0是回归直线在 y 轴上的截距β1称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值3、判定系数:是对估计的回归方程拟合优度的度量。
0≤ R2 ≤1;R2 越接近1,说明回归方程拟合的越好,越接近0,说明回归方程拟合的越差4、点预测0100ˆˆˆx y ββ+=第九章时间序列分析一、 时间序列概念1、 时间序列的分类(1) 绝对数时间序列又分时期序列和时点序列(2) 相对数时间序列(3) 平均数时间序列注意:时期和时点序列的区别?2、编制时间序列遵循的原则?二、时间序列的水平分析----------专业最好文档,专业为你服务,急你所急,供你所需-------------1、发展水平2、平均发展水平重点是会计算各种时间序列的平均数 3增长量 (1)逐期增长量1--=∆i i i y y y(2)累积增长量0y y y i i -=∆重点会计算增长量以及逐期和累积增长量两者数量关系。
4、平均增长量重点会计算平均增长量 三、时间序列的速度分析 1、发展速度 (1)环比发展速度 (2)定基发展速度计算以及两者之间的数量关系。
2增长速度----------专业最好文档,专业为你服务,急你所急,供你所需-------------3平均发展速度 利用几何平均数计算 4平均增长速度 等于平均发展速度-1 四、时间序列的变动因素分析 1、时间序列的构成要素长期趋势T ,季节变动S ,循环变动C ,不规则变动I 2、长期线性趋势变动分析——直线趋势方程拟合法 原始数据的特点:逐期增长量近似一个常数。
3、季节变动测定季节变动的指标:季节指数季节指数大于100%说明该月(季)是“旺季”,反之是“淡季”,当季节指数等于100%时,说明该月(季)不受季节因∑⇒=0t----------专业最好文档,专业为你服务,急你所急,供你所需-------------素的影响。
第十章统计指数一、指数的概念及分类 1、指数的概念与性质2、数量指标指数和质量指标指数 二、综合指数1、 综合指数编制的基本原理。
首先引入同度量因素,解决多种事物不能加总的综合问题;(同度量因素的作用)其次对比。
固定同度量因素,使综合总量的对比只反映指数化指标的变化。
2、 拉氏指数(1) 拉氏指数将同度量因素固定在基期;(2) 计算数量指标的综合指数一般采用拉氏指数;∑∑=0010qp q p I q(3)同度量因素固定在基期时,指标化因素的变动所引起总指标的绝对数量为∑∑-0010qp q p----------专业最好文档,专业为你服务,急你所急,供你所需-------------3、 派(帕)氏指数(3) 派氏指数将同度量因素固定在报告期期; (4) 计算质量指标的综合指数一般采用派氏指数;∑∑=1011qp q p I P(3)同度量因素固定在报告期时,指标化因素的变动所引起总指标的绝对数量为∑∑-1011qp q p三、 平均指数1、 平均指数编制的基本原理首先对构成总体的个别元素计算个体指数,得到无量纲化的相对数作为编制总指数的基础;其次选择合适的权数对个体指数进行加权平均,从而得到反映总体现象数量对比关系的总指数。
2、 加权算术平均指数在已知基期总量00q P 的条件下,以其为权数对个体指数进行加权平均----------专业最好文档,专业为你服务,急你所急,供你所需-------------∑∑=00001q p q p q q I q3、 加权调和平均指数在已知报告期总量11q P 的条件下,以其为权数对个体指数进行加权平均∑∑=1101111q p p pq p I p四、 指数体系与因素分析 1、 指数体系的概念以及作用概念:指数体系是指不仅具有一定联系,而且保持一定数量对等关系的三个或三个以上的指数所构成的一个整体。
作用:(1) 可以进行因素分析(2) 可以进行指数之间的互相推算当已知指数体系中的某几个指数时,可以推算出某个未知指数。
2、 因素分析----------专业最好文档,专业为你服务,急你所急,供你所需-------------(1) 总量指标变动两因素分析 相对数关系∑∑∑∑∑∑⨯=001010110011qp q p q p q p qp q p绝对数关系()()∑∑∑∑∑∑-+-=-001010110011q p q p q p q p q p q p。