当前位置:文档之家› 第八章 抽样调查与推断

第八章 抽样调查与推断

第8章抽样调查与推断【教学内容】本章主要阐述:抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式及其抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。

【教学目标】1、理解抽样误差的影响因素;2、掌握抽样调查的概念、特点和作用;3、掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定原理及方法;4、初步具备在实际工作中正确运用抽样方法搜集资料并据以做出准确推断的能力。

【教学重点、难点】1、抽样调查的特点和作用;2、抽样调查的组织方式和方法;3、抽样误差的概念与计算;4、抽样推断方法;5、必要抽样数目的确定方法。

第一节抽样调查的一般问题一、抽样调查的概念、特点与作用(一)抽样调查的概念与特点概念:抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。

特点:(1)按随机原则抽取调查单位。

(2)由部分推断全体。

(3)抽样误差可以事先计算并加以控制。

(二)抽样调查的作用1、用于不可能进行全面调查的无限总体。

2、用于不可能进行全面调查而又需要了解全面情况的现象。

3、用于不必要进行全面调查的现象。

4、用于对全面调查的资料进行评价与修正。

5、用于工业生产过程的质量控制。

二、抽样调查中的几个基本概念(一)全及总体和抽样总体1.全及总体全及总体简称总体或母体,它是指所要调查研究对象的全体。

2.抽样总体抽样总体也称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。

(二)总体指标和样本指标1.总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。

2.样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。

三、抽样调查的组织方式(一)简单随机抽样概念:简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排序(队),而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。

方法:(1)重复(置)抽样即从全及总体中,每次抽取一个总体单位进行调查,经登记后再把它放回总体中参加下一次的抽取,直到抽取n个总体单位。

如果按重复抽样的方法抽选样本,可能的组(配)合样本有:(2)不重复(置)抽样即从全及总体中,每次抽取一个总体单位进行调查,经登记后不再把它放回总体中参加下一次的抽取,依此抽选直到抽取n个总体单位。

如果按不重复抽样的方法抽选样本,可能的组(配)合样本有:(1)抽签法。

具体做法是:当给总体各单位编号后,把号码写在结构均匀的签上,将签混合均匀后即可以从中抽取。

(2)随机数字法。

随机数字可以借助于计算机获得,也可应用随机数表,其中随机数表方法应用较为普遍。

表8-1 随机数字表(部分)(二)分层(类型)抽样●分层(类型)抽样又称分类抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。

●分层(类型)抽样的样本单位数在各类型之间的分配有三种方法:(二)分层(类型)抽样等数分配分层(类型)抽样法。

等比例分层(类型)抽样法。

不等比例分层(类型)抽样法。

(三)等距抽样等距抽样也称机械抽样或系统抽样,它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。

图8-1 等距抽样示意图抽样距离的计算公式为:(四)整群抽样整群抽样也称集团抽样、区域抽样或分群随机抽样,它是将总体各单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对被选中群的所有单位进行全面调查的抽样组织方式。

第二节抽样误差一、抽样误差的概念概念:调查误差是指调查所获得的统计数据与调查总体未知真实数据之间的差别,它包括登记性误差和代表性误差两种。

1、代表性误差代表性误差是用样本指标数值去推断总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。

2、登记性误差是在调查过程中由于主客观原因而引起的登记性差错所造成的误差。

二、影响抽样误差的主要因素抽样误差的大小受以下几个因素的影响:(一)样本单位数(样本容量n)的多少(二)总体被研究标志变异程度(总体方差σ2)的大小(三)抽样组织方式(四)抽样方法三、抽样平均误差(一)抽样平均误差的概念在一定组织方式下进行抽样调查,根据统计研究的目的和任务,可以取一个样本,也可以取多个样本。

在抽取多个样本时,就其中每个样本来说,都有其相应的样本指标。

抽样平均误差是指以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,以符号表示,通常以代表平均数的抽样平均误差,以μp代表成数的抽样平均误差,以K代表可能组成的样本总数。

(二)计算抽样平均误差的理论公式根据抽样平均误差的概念可得其一般计算公式:[例8-1]为叙述简便,假设有10、20、30和40这4个数字组成一个总体,从中随机抽取两个数字作为样本,求抽样平均误差。

总体平均数为:采取重复抽样法,可能组(配)合的样本数及相应指标的计算见表8-2。

全部可能样本平均数的平均数()等于总体平均数( ),即:表8-2 重复抽样的样本数及相应指标计算表表8-3 不重复抽样的样本数及相应指标计算表(三)抽样平均误差的计算方法1.平均数的抽样平均误差。

2.成数的抽样平均误差。

[例8-2]某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为85%。

现按简单随机抽样方式从800只仪表中抽取10%进行检验,求合格品比率的抽样平均误差。

由上述可知:在重复抽样条件下:在不重复抽样条件下:[例8-3]某大学有4 500名学生,采用不重复简单随机抽样方式从中抽取10%的学生,调查其每月生活费用支出情况。

抽样结果显示,学生平均每人每月生活费支出800元,标准差200元,生活费用支出在1 000元以上的学生占全部学生的20%。

试求抽样平均误差。

由上述可知:(四)其他抽样组织方式抽样平均误差的计算方法1.分层(类型)比例抽样平均误差的计算。

(1)平均数的抽样平均误差。

(2)成数的抽样平均误差。

[例8-4]某县对某种农作物的产量进行一次分层(类型)比例抽样调查。

调查资料整理的结果见表8-4,试求抽样平均误差。

表8-4 分层(类型)抽样平均误差计算表2.等距抽样平均误差的计算。

直接计算等距抽样的平均误差,在实践中是一个不容易解决的问题。

一般认为如果总体单位是按无关标志排序(队)的,它的抽样误差就十分接近简单随机抽样的误差,为了简便起见,可以采用简单随机抽样平均误差公式来近似地计算。

同理,如果总体单位是按有关标志排序(队),其抽样平均误差可采用分层(类型)抽样平均误差的公式计算其近似值。

3.整群抽样平均误差的计算。

(1)平均数的抽样平均误差。

(2)成数的抽样平均误差。

[例8-5]某商店购进300箱(50只/箱)苹果,入库前随机抽取1%检查其质量。

检验结果的整理资料见表8-5,试求抽样平均误差。

表8-5 整群抽样平均误差计算表首先,分别计算样本平均数和样本成数。

其次,分别求出样本平均数的群间方差和成数的群间方差。

最后,根据[公式8-20]和[公式8-21]求出μx和μp。

第三节总体指标的推断一、点估计1、概念点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值( x ,p)直接作为总体未知参数( x ,P)的估计值的一种推断方法。

2、三个标准在实际中,根据不同样本数据或用不同的方法来估计同一个总体参数,可能会得到不同的估计量。

但哪一个估计量更好一些,其评判通常采用下面三个标准:1.一致性。

设θ为未知参数θ的估计量,当n→∞时,要求θ按概率收敛于θ,即:2.无偏性。

若要求估计量θ的数学期望等于未知参数的真值θ,即:3.有效性。

无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。

二、区间估计1、概念区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。

2、内容第一:这一可能范围的大小;第二:总体指标落在这个可能范围内的概率。

[例8-1]样本平均数的概率分布见表8-6。

表8-6样本平均数的概率分布把这全部可能的样本平均数编制成变量数列(见表8-6),然后再将它们绘成图形,即可得到一个钟形的平滑曲线(如图8-2所示)。

图8-2 正态分布曲线图抽样估计的置信度就是表明样本指标和总体指标的误差不超过一定范围的概率有多大。

图8-3 样本指标置信度图[例8-7]利用[例8-3]的资料,在95.45%的置信度下估计全体学生月平均生活费用的可能范围,以及月生活费用在1 000元以上学生所占比重的可能范围。

[例8-8]从某县农民家庭中随机抽取100户调查其年收入情况。

农民家庭按年人均纯收入额分组的资料见表8-7。

要求以95%的置信度对全县农民家庭的年人均纯收入和年人均纯收入在10 000元以上户数所占比重作出区间估计。

表8-8 某县百户农民家庭按年人均纯收入分组抽样指标计算表第四节必要抽样数目的确定一、影响必要抽样数目的主要因素有下列几个: (一)总体被研究标志的变异程度(二)对推断精确度的要求(三)对推断可靠性的要求(四)抽样调查的组织方式和方法(五)人力、物力和财力的允许条件二、确定抽样数目的方法(一)在重复抽样条件下推断总体平均数所需要的抽样数目:推断总体成数所需要的抽样数目:(二)在不重复抽样条件下推断总体平均数所需要的抽样数目:推断总体成数所需要的抽样数目:。

相关主题