抽样调查
(二)全及指标和抽样指标 1、全及指标:根据全及总体中的各单位标志值或标志特征
计算的、反映总体某种属性的综合指标。又 称统计参数。它是唯一确定的。 变量总体:
属性总体:
N1 具有某种属性的单位数 , N0 不具有某种属性的单位数
属性总体成数方差公式推导:
X
F
及格
1
N1
不及格
0
N0
则属性总体的平均数
抽样调查
2020年7月15日星期三
掌握
本章要求
1、基本概念 2、抽样指标计算 3、抽样平均误差的影响因素及计算 4、全及指标推断:抽样极限误差计算、置
信区间计算
5、简单随机抽样重复抽样的必要抽样单位 数计算
理解
1、抽样调查分类 2、抽样调查特点 3、全及总体分类及全及指标 4、抽样方式分类 5、抽样误差概念及分类 6、抽样平均误差影响因素 7、可信程度、概率度 8、抽样方案设计基本原则 9、主要的抽样组织方式种类
2、总体标志的变异程度,大则多,小则少。 3、抽样组织方法。简单随机抽样所需要的抽样单 位数一般大于类型抽样或机械抽样,不重复抽样所 需要的抽样单位数少于重复抽样。
4、根据成本效益原则。
返回目录
第五节 抽样方案设计
一、抽样方案设计的原则
1)保证实现抽样随机性的原则; 2)保证实现最大抽样效果原则。
一、基 本 概 念
(一)全及总体和抽样总体
1、全及总体:所要认识对象的全体。它是唯一的、
确定的。
变量总体: 总体中总体单位的标志为数量标志 属性总体: 总体中总体单位的标志为品质标志 2、抽样总体:从全及总体随机抽取得部分单位的集合体。
一个全及总体中,可以抽取多个抽样总体,即抽样总体 不是唯一的、确定的。一般认为,样本容量大于或等于30个 单位数时称为大样本,小于30个单位数时称为小样本。
二、抽样组织形式
(一)简单随机抽样
1)直接抽选法; 2)抽签法 3)随机数码表法
(二)类型抽样(分类抽样、分层抽样)
类型抽样是先对总体各单位按一定标志加以分类 ,然后再从各类中按随机原则抽取样本,由各类中的 样本组成一个总的样本。
确定各类型组的抽样单位数: (1)标志差异大的组多抽一些,标志差异小的组少 抽一些; (2)按各组的单位数占总体单位数的比例来确定各 组的抽样单位数,称为类型比例抽样,这是通常采用 的方法。 适用于各组组间单位标志差异较大,而组内差异 较小的情况。
抽样平均误差:所有可能抽取的样本的指标的标准差,代 表了所有样本平均数(成数)与总体平均数(成数)的差距的 平均,可以计算,我们讨论的就是这种误差。
抽样中的 总误差
登记性误差
偏差:系统性误差 代表性误差
实际误差
随机误差:偶然误差
抽样平均误差
二、抽样平均误差的计算 1、理论公式
实际上,全及指标是未知的,而且实践中只会抽 样一个样本。所以这个公式实践中不采用。
30
合计
500
10.5
420
4410
41.62
11.5
345 3967.5 122.41
—
4740 45245 309.8
分别计算重复抽样和不重复抽样方式下电子器件的抽样 平均误差。
重复抽样下: 不重复抽样下:
例3:
如果寿命低于9000小时的产品是不合格品,计算 不合格率的抽样平均误差。 不合格率:
登记性误差与测量工具的精度、测量技术、调查人员的 责任心、被调查者的合作态度等密切相关。
代表性误差:抽样过程中产生的以及用部分去推断总体过 程中产生的误差。(一般不可避免)
代表性误差又分为两种:
➢偏差:系统性误差
由非随机因素(违背随机原则)造成样本代表性不足而 产生的误差。表现为样本统计量的值系统性偏高或偏低。这 种误差也属于工作态度、水平、技术等的问题。应尽量避免 。➢随机误差:偶然性误差
不重复抽样:
例2
某公司进口一批电子器件5000件,为了检测其寿命, 抽取了500件进行检验,结果如下:
寿命 器件数 组中值
千小时 (只)
8以下
20
7.5
150
1125
78.41
8-9
70
8.5
595 5057.5 67.23
9-10
340
9.5
3230 30685 0.136
10-11
40
11以上
1、抽样误差:来源于登记性误差和代表性误差。
登记性误差:调查误差或工作误差,指在调查、编辑、编 码、汇总过程中由于观察、测量、登记、计 算上的差错或被调查者提供虚假资料而引起 的误差。
这种误差的直接表现就是没有真实客观地搜集或记录被 调查单位的标志值或标志特征,从而使所计算的统计量偏离 其真实值。
登记性误差存在于所有的统计调查中,而且调查的范围 越大、调查单位越多,产生误差的可能性越大。
2)用部分推断总体;
3)抽样遵循随机原则;
4)会产生抽样误差,但误差可以计算和控制。
3、统计误差
统计数字与各种实际数量之间的差别。
登记误差: 调查误差或工作误差,指在登记、汇总计 算过程中产生的误差。(可以避免的)
代表性误差:用部分去推断总体产生的误差。(
一般不可避免)
返回目录
第二节 基本概念及理论依据
趋近于总体平均数 ,抽样成数p趋近于总体成数P。这 为抽样推断提供了重要依据。
2、中心极限定律:
该定律证明,不论总体服从何种分布,只要它的数学 期望和方差存在,从中抽取容量为n的样本,当n足够大, 则这个样本的平均数 趋于正态分布。这为抽样误差的概 率估计提供了依据。
返回目录
第三节 抽样平均误差
一、抽样误差的概念和理解
遵循了随机原则的原则,由偶然因素引起样本结构不能 完全代表总体结构而产生的误差。偶然误差不可避免,即使 没有登记误差和系统性误差,仍会存在误差。 虽然不可避免 ,但可以估计和控制。偶然误差总和等于0。
全面调查不存在偶然误差。
随机误差又可以分为实际误差和抽样平均误差。
实际误差:样本指标与总体指标之间的实际差别,这种 无法直接计
1、抽样调查概念
广义:抽取部分单位观察,并根据观察结果推断全体。
狭义:按照随机原则抽取部分单位观察,并运用数理 统计方法,由部分对总体做出数量上的推断分析。
随机抽样:保证总体中各单位具有同等机会被抽中 ,客观地抽取样本,并推断总体。
2、特 点
1)只抽取部分单位;
2、抽样指标:根据抽样总体中的各单位标志值或标志特征
计算的综合指标。又称统计量,是一个随机 变量。 变量总体:
属性总体:
n1 具有某种属性的单位数 , n0 不具有某种属性的单位数
(三)抽样方法和样本可能数目
1、抽样方法:从全及总体随机抽取得部分单位的取样方法。
样本数目与样本容量有关,也与抽样方法有关,样本容 量既定,则样本数目取决于抽样的方法。
一、概述
抽样调查的目的是为了用样本指标推断总体
指标。对总体指标的估计方法有两种:一种是点 估计,另一种是区间估计。
1、点估计:
或
它不能说明误差大小,意义不大。但它可以说
明优良估计的标准。(无偏性、一致性和有效性)
2、区间估计
可以将误差控制在一定的范围内(即说明总体
指标在某一范围内的可能性大小) 。
了解
1、抽样调查的意义 2、抽样调查的适用范围 3、不同抽样方式的可能样本数目 4、抽样调查的理论依据 5、抽样平均误差的意义 6、各种抽样组织方式介绍 7、不重复抽样的必要抽样单位数计算
第一节 概 述 第二节 基本概念及理论依据 第三节 抽样平均误差 第四节 全及指标推断 第五节 抽样方案设计
(三)机械抽样(等距抽样、系统抽样)
机械抽样是对研究的总体按一定的顺序 排列,每隔一定的间隔抽取一个或若干个单 位,将这些抽取的单位组成样本。
方法有: (1)随机起点等距抽样 (2)半距起点等距抽样 (3)对称等距抽样 机械抽样是一种简单易行的,在大规模 抽样调查中常用的方法。
(四)整群抽样
整群抽样是将总体划分为由总体单位所组成 的若干群,然后以群为抽样单位,从总体中抽取 若干个群体作为样本,对选中群内的所有单位进 行全面调查的抽样方式。
2、抽样平均误差的影响因素:
1)全及总体标志变动程度。总体标志变动越大, 抽样平均误差越大,反之则越小。 2)抽样单位数的多少。其他条件不变,抽取的 单位数越多,抽样平均误差越小,反之越大。
3)抽样方法。重复抽样的平均误差大,不重复 抽样的平均误差小。
4)抽样的组织方式。
返回目录
第四节 全及指标的推断
当群间差异较小,而群内差异较大时适合采 用。或者说,在分群时应使群内方差尽可能大, 而使群间方差尽可能小。
(五)多阶段抽样
多阶段抽样是先从总体中抽取部分群,再从 抽中的群内抽取部分群或单位进行调查。比如对 某省农户进行调查,先从全省抽取部分县作为第 一阶段抽取的样本,再从抽中的县内,抽取部分 乡或村作为第二阶段抽取的样本,再从抽中的乡 或村内,抽取部分农户进行调查。
重复抽样下:
例如:一个盒子里有三个球,标号分别为1、2、3,现从中随 机抽取两个。即N=3,n=2:
1)考虑顺序的重复抽样
1 23
2)考虑顺序的不重复抽样
1 11 12 13
3)不考虑顺序的重复抽样
2 21 22 23 3 31 32 33
4)不考虑顺序的不重复抽样
二、抽样调查的理论依据
1、大数定律:
该定律表明,当样本单位数n足够大时,抽样平均数
总体指标所落在的区间范围。
抽样平均误差说明估计的准确 程度,因此可 以将抽样平均误差作为误差单位(当然在不同的条 件下,这个单位的具体值是不同的),抽样极限误 差可以表示为多少个误差单位(即抽样平均误差的 多少倍),表示为: