统计师考试知识点讲解:抽样误差
1.抽样误差的概念
(1)抽样误差
统计误差:是指在统计调查中,调查资料与实际情况间的偏差。
即抽样估计值与被估计的未知总体参数之差.
统计误差按产生来源分:登记误差和代表性误差
登记误差:又称工作误差或调查误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。
调查范围越广,规模越大,误差的可能性就越大
代表性误差:在抽样调查中,用样本推断总体所产生的误差。
抽样误差:指在遵循了随机原则的条件下,不包括登记误差和系统误差在内的,用样本指标代表总体指标而产生的不可避免的误差。
由于总体平均数、总体成数是唯一确定的,而样本平均数、样本成数是随机变量,因而抽样误差也是一个随机变量。
抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。
同时抽样误差还说明样本指标与总体指标的相差范围,因此,它是推断总体指标的依据。
抽样误差是统计推断所固有的,虽然无法避免,但可以运用数学公式计算。
因此,抽样误差也称为可控制的误差。
(2)影响抽样误差的因素
①抽样单位的数目:数目越大,越接近总体。
②总体被研究标志的变异程度:抽样误差和总体标志的变异程度成正比变化。
③抽样方法的选择:不重复抽样比重复抽样的抽样误差小。
④抽样组织方式不同。
不同的抽样组织所抽中的样本,对于总体的代表性也不同。
2.抽样平均误差的计算
(1)抽样平均误差的涵义
抽样误差有抽样实际误差和抽样平均误差两种。
抽样实际误差是指某一次抽样结果所得到的样本指标与总体指标数值之差。
抽样实际误差不能用来概括一系列抽样结果可能产生的所有误差,因此为了用样本指标去推算总体指标,需要计算这些误差的平均数,即抽样平均误差,用它来反映抽样误差的平均水平。
抽样平均误差是指所有可能出现的样本指数的标准差。
我们把抽样平均误差简称为抽样误差,并用希腊字母μ来表示。
(2)抽样平均误差的计算
抽样推断的两个主要目的:以样本平均数推断总体平均数,以样本成数推断总体成数。
同时,在简单随机抽样时又有重复抽样和不重复抽样的两种取样方法。
统计师考试辅导:国民经济相关练习题
时间数列的分析与预测
1.时间数列的基本构成要素与分解
(1)时间数列的基本构成要素
在进行时间数列分解时,一般把时间数列的构成因素按性质和作用分为四类:即长期趋势、季节变动、循环波动和不规则变动。
长期趋势:时间数列在长时期内呈现出来的某种持续上升或持续下降的变动称为长期趋势。
是对未来进行预测和推断的主要依据。
长期趋势往往是由某些固定的、系统性的因素造成的。
代表着研究对象的总发展方向,它既可以是线性的,也可以是曲线的。
季节波动:时间数列在一年内重复出现的周期性波动称为季节波动。
季节波动中“季节”一词不仅仅是指一年中的四季,其实它是广义的指任何一种周期性的变化。
循环变动:时间数列呈现出来的围绕长期趋势的一种波浪形或震荡式变动称为循环变动,也称作周期变动。
周期性变动没有固定规律,其循环的幅度和周期的波动性很强,而且其周期短的一般也要3-5年,长的可达几十年。
不规则变动:由各种偶然的、突发的或不可预见的因素引起的,称为不规则变动或随机变动。
(2)时间数列的分解模型
时间数列分析的一项主要内容就是把这几个影响因素从时间数列中有目的的分离出来,或者说对数据进行分解、清理,并将他们的关系用一定的数学关系式予以表达。
加法模型:假定四种变动因素相互独立,时间数列各时期发展水平是各个构成因素的总和。
用数学表达为:Y=T+S+C+I
乘法模型:假定四种变动因素彼此间存在着交互作用,时间数列各时期发展水平是各个构成因素的乘积,其数学表达式:Y=T·S·C·I
T代表长期趋,S代表季节变动,C代表循环变动,I代表不规则变动。
需要说明:加法模型中,各个因素都是绝对数,乘法模型中,除了长期趋势是绝对数外,其他因素都是以相对数或指数的形式出现的。
最后要指出:时间数列分析并不能作为对前景预测的唯一依据。
在利用时间数列分析的规律对社会经济现象进行预测时,预测的时间跨度不宜过长,并要注意对一些影响其发展的主要因素进行分析。
2.长期趋势的测定
长期趋势的测定通常有修匀法和数学模型法。
(1)修匀法
基本思路:通过对相邻项的合并或求平均来消除时间数列中的偶然因素,使得数列的主要运动方向趋势比以前更加明显,又可分为时距扩大法和移动平均法两种方法。
①时距扩大法
时距扩大法是将原时间数列中各期指标数值加以合并,得出一个扩大了时距的新时间数列,这是测定长期趋势的最简单最原始的方法。
使用时距扩大法注意:
首先,这一方法只适用于时期数列;
其次,时距扩大程度不是随意的,而应该遵循事物发展的客观规律;
最后,扩大后的时距要一致,相应的发展水平才具有可比性。
统计师考试中级统计实务:综合汇总方法(1)
综合汇总方法
(1)直接综合法
直接综合法是指直接将进行过同度量处理的指标数值(变量值)经简单加总而形成一个综合值,再按照综合值的大小排出各参评单位的位次,从而达到综合评价目的的方法。
直接综合法适用于不进行加权的综合评价,如果需要加权,一般不采用直接综合法。
(2)加权平均综合法
加权平均综合法是指对经过同度量处理的指标数值通过加权平均进行综合,形成一个总值,再按照总值的大小排出各参评单位的位次,从而达到综合评价目的方法。
(3)综合记分法
综合记分法是指对各指标数值通过对比记分,转换为分值,然后将各部分值加总,计算综合分值,从而进行比较排序的方法。
步骤:首先对各指标进行同度量处理,一般常采用相对化处理;
然后根据记分的规定进行评分;
最后,对每一单位的各项指标的分值进行汇总,并根据汇总结果进行比较排序。
分值的汇总可以是对各项指标分值的简单相加,也可以进行加权计算。
由于汇总方法不同,最后对汇总结果的排序有可能不同。
关于记分法:记分法的设定是多种多样的,可实行三档记分法,也可实行五档记分法。
当指标的实际值均为动态相对数时,可以按各指标的变动幅度设定记分法,对其他指标则一般是在指标值的同度是处理后按设定的记分法进行记分。
第三步,根据第二步计算出的各单位指标实际值与标准值之间的总距离进行评价。
距离标准值越近,即Sj越小,说明综合状态越好;距离标准值越远,即Sj越大,说明综合状态越差。
此外还要加以说明的是,在应用距离法对指标数据进行综合之前,可以先对其进行相对化处理,用指标的实际值分别除以标准值,得到相对化处理后的指标实际值,这样可以简化计算。
(4)距离法
现实中的某些现象人们往往认为它们能够在一定范围之内变化才较为理想。
对这类问题的综合评价,可以采用距离法。
距离法的基本思想是:对每一个参评指标确定相应的标准值作为进行比较的依据。
将参评单位看作n维空间中由n个参评指标值确定的点,计算它们与n个标准值确定的标准点之间的距离。
具体步骤:
第一步,对每一个参评指标确定相应的标准值,作为进行比较的依据。
第二点,计算每一单位的各指标实际值与标准值之间的总距离。
统计师考试辅导资料:相关分析应注意的问题
(1)相关系数不能解释两变量间的因果关系
相关系数只是表明两个变量间互相影响的程度和方向,它并不能说明两变量间是否有因果关系,以及何为因,何为果,即使是在相关系数非常大时,也并不意味着两变量间具有显着的因果关系。
例如,根据一些人的研究,发现抽烟与学习成绩有负相关关系,但不能由此推断是抽烟导致了成绩差。
因与果在很多情况下是可以互换的。
比如,研究发现收入水平与股票的持有额正相关,并且可以用收入水平作为解释股票持有额的因素,但是否存在这样的情况,你赚的钱越多,买的股票也越多,而买的股票越多,赚的钱也就越多,何为因?何为果?众所周知,经济增长与人口增长相关,可是究竟是经济增长引起人口增长,还是人口增长引起经济增长呢?不能从相关系数中得出结论。
(2)警惕虚假相关导致的错误结论
有时两变量之间并不存在相关关系,但却可能出现较高的相关系数。
如存在另一个共同影响两变量的因素。
在时间序列资料中往往就会出现这种情况,有人曾对教师薪金的提高和酒价的上涨作了相关分析,计算得到一个较大的相关系数,这是否表明教师薪金提高导致酒的消费量增加,从而导致酒价上涨呢?经分析,事实是由于经济繁荣导致教师薪金和酒价的上涨,而教师薪金增长和酒价之间并没有什么直接关系。
原因的混杂也可能导致错误的结论。
如有人做过计算,发现:在美国,经济学学位越高的人,收入越低,笼统地计算学位与收入之间的相关系数会得到负值。
但分别对大学、政府机构、企业各类别,计算学位与收入之间的相关系数得到的则是正值,即对同一行业而言,学位高,收入也高。
另外,注意不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持。
雨下的多,农作物长的好,在缺水地区,干旱季节雨是一种福音,但雨量太大,却可能损坏庄稼。
又如,广告投入多,销售额上涨,利润增加,但盲目加大广告投入,却未必使销售额再增长,利润还可能减少。
正相关达到某个极限,就可能变成负相关。
这个道理似乎人人都明白,但在分析问题时却容易忽视。