抽样技术概述
第四章 抽样技术概述
• 学习要点
一、理解和掌握抽样调查的概念、特点和作用。 二、掌握抽样技术中常用的基本概念。 三、熟练掌握抽样平均误差的概念、影响因素和计算方法 四、熟练掌握极限抽样误差的概念和计算方法。 五、掌握必要抽样数目的意义和计算。 六、了解全及总体总量指标的推算和抽样调查组织方式。
第一节 抽样技术概念
一、抽样技术的涵义
抽样技术是统计学的重要分支,它已经成为当今世界上最重 要的统计方法。它广泛应用于社会、经济、科技和自然等各个领 域,成为现代统计学中发展最快、最活跃的一个分支。
抽样技术的完整概念应包括对样本的调查和对总体数据的估 计两个方面。这里首先介绍抽样调查,然后介绍总体数据估计的 基本理论和方法。
2.区域抽样框,按自然地域划分并排列出总体所有单位。如, 一片土地划分为若干地块并编号、一片森林划分为若干林区并编 号等。
3.时间表抽样框,按时间顺序排列总体单位。如,流水线生 产的产品质量检验,把一天划分为若干时段并按顺序排列。
抽样框的编制是抽样调查的前提条件,要求不重不漏来保证 样本对总体的代表性。
(三)用于采集灵敏度高、时效强、时间要求紧迫的资料。
如市场动态、商品交易额、股市行情、抢险救灾和战时物资 质量检验等。
(四)与其他调查方式结合运用,互相补充与核对。
如,抽样技术与普查相结合可以检查核对普查数据的准确 性;与重点调查相结合,有利于掌握总体数量特征。
(五)进行假设检验,判断真伪。
如,某项新工艺、新配方或农业新品种在生产中的推广是否 具有显著价值,可通过抽样推断进行假设检验,决定是采用还是 放弃。
(三)在推断手段上,以概率估计方法进行总体推断。
抽样估计是以概率论为基础的估计方法,用样本数据估计总 体数据时,其可靠性用一定概率保证程度来说明。例如,用城市 居民样本数据估计某电视节目的收视率、用居民样本数据估计全 市居民家庭收支情况等等。
(四)在推断理论上,用大数定律的中心极限定理为基础。
中心极限定理证明随着样本单位数的增加,样本变量分布趋 向正态分布,样本平均数接近总体平均数、样本标准差接近总体 标准差,从而为用样本数据估计总体相应数据提供了科学的理论 依据和方法。
(二)抽样估计
抽样估计是在抽样调查的基础上,利用样本数据根据概率论 来估计总体相应数据的统计分析方法。
(三)抽样技术
总体、总体指标、样本、样本指标、抽样误差、概率估计等 概念构成了抽样技术中的最基本范畴。它们的关系如图4-1。
图4-1
总体
反 映
总体指标
抽样技术关系图 随机取样
样本
概率估计
调查 整理 汇总
(四)参数和统计量
1.参数 总体平均数用 X 表示,总体标准差用σ2表示,总体成数用P 表示,这些数据在抽样技术称为参数。由于总体是唯一确定的, 总体参数也是唯一确定的。
2.统计量
样本平均数用 x表示,样本标准差用s表示,样本成数用p表
示,这些数据在抽样技术称为统计量。
成数指总体或样本中具有某种属性的单位数占全部单位数的 比重。如,一片森林中病株数的比重、一批产品中合格品比重、 一片农作物中缺苗断垄数比重、某市居民拥有电脑户比重、某电 视节目收视率等等。
(二)总体和样本
总体指所要研究现象的整体用字母N表示。如,从一万平方 米小麦中抽取500平方米进行产量调查,则N=10000平方米。
样本,指从总体中抽取的样本单位数,用字母n表示。如, 上例中n=500平方米
(三)大样本和小样本
大样本和小样本是根据样本容量多少来划分。n≥30时为大 样本,n<30时为小样本。
四、抽样技术中的几个基本概念
(一)抽样框
是指供抽样所使用的所有调查单位的详细名单。如,从5万 名职工中随机抽取300名职工组成一个样本,则5万职工的名册就 是抽样框。
抽样框有以下形式:
1.名单抽样框,即以名册或清单形式列出总体所有单位。如, 学生名册、企业名录、职工名单、住户名单、村庄名单、社区名 单等等。
二、抽样技术的特点
(一)在调查单位的抽取上,遵循随机原则。
随机原则使样本单位的抽取不受任何主观因素影响,使所抽 取的样本变量分布与总体变量分布相类似,从而保证样本的代表 性和估计的无偏性。
(二)在调查功能上,用样本数据估计总体数据。
抽样调查是非全面调查,它具有从部分到总体、由具体到一 般的推断功能。
本节小结:
(一)样本是从总体中随机的一部分单位。
(二)参数是总体数量特征,是用样本统计量估计出来的。 (三)统计量是由样本变量直接计算得到的。
第二节 抽样调查和抽样误差
(五)在推断效果上,抽样误差可以计算并加以控制。
用样本数据估计总体相应数据会存在一定误差,根据中心极 限定理和正态分布规律,抽样误差可以事先计算出来并可以控制, 从而使抽样估计具有一定的可靠程度。
三、抽样技术的作用
由于抽样技术具有费用低、时效强、准确度高、应用范围广 等优点,抽样技术广泛应用于众多领域。
(一)用于那些不能或难以采用全面调查的情况。
无限总体,如宇宙探测、大气监测或生态保护等的调查;动 态总体,如产品质量监测、物价管理等的调查;范围大,分布过 散的有限总体,如居民收支调查、水中鱼苗调查、森林木材蓄积 量等调查。
(二)用于不宜全面调查,而须了解总体数据的情况。
如,灯泡、轮胎等产品的耐用时间破坏性质量检验;饮料食 品等品尝性检验;人体血液等健康性检验等。
样本指标
(四)抽样设计
是指从研究总体中抽取样本之前,预先确定抽样方案。将调 查资料使用者、抽样专家、活动组织者和数据处理人员召集起来 协商探讨共同确定抽样方案。基本内容有:1.确定目的、任务和 要求;2.确定抽样框和样本单位;3.确定组织方式和抽取样本单 位的方法;4.确定估计精度要求;5.确定抽样数目和估计方法; 6.确定总体方案和工作程序。
(一)抽样调查
它是一种非全面调查,是根据随机原则从总体中抽取部分单 位进行调查。这部分单位称为样本。而这部分单位数目的多少不 是随心所欲确定的,是根据一定原则和要求用科学的方法计算来 确定。所谓随机原则,就是可能性原则,是指在抽取样本单位时, 完全排除人们的主观愿望,使总体中的每个单位机会均等,抽中 与否全凭偶然。