统计学原理第六章抽样调查
三、抽样平均误差的意义
1. 在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的一般范围。 3. 确定抽样单位数多少的计算依据。
四、抽样平均误差的计算
抽样平均误差实际上是样本指标的标准差。 通常用μ表示。
x p
抽样误差范围的实际意义是要求被估计的 全及指标 X 或P落在抽样指标一定范围内,即
落在 x x 或 p p 的范围内。
3.可信程度 抽样极限误差△=tμ,(t为概率度)
可见,抽样极限误差,即扩大或缩小了以后的 抽样误差范围。
例
n N n
5
(2)不考虑顺序的重复抽样:D C
n N
n N n 1
2. 如果是不重复抽样:
⑴考虑顺序的不重复抽样:
N! A N ( N 1)( N 2)( N n 1) ( N n)!
n N
例
5 A50 50 49 48 47 46 254 251 200 ( 种)
935 890 45(头) 差错率 45 890 可用5.06%的系数来修正6000农户养猪头数,即: 9000 (1 5.06%) 9455(头) 5.06%
例2
某市房地局,年报工资总额3218.1万元。 现抽查14个单位: 年报:415.03万元 多报:0.44万元 少报:1.47万元 抵冲后 1.47-0.44=1.03(万元)
三、抽样方法和样本可能数目 抽样方法
根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。 根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考 虑顺序抽样。
样本可能数目(p256-257,了解)
1. 如果是重复抽样:
(1)考虑顺序的重复抽样:B N (样本种数) 例 50 312,500,000种
抽取样本
10 10 10 10 10 20 20 20 20 20 30 30 30 10 20 30 40 50 10 20 30 40 50 10 20 30
样本平均数 x 误差 x X
10 15 20 25 30 15 20 25 30 35 20 25 30 -20 -15 -10 -5 0 -15 -10 -5 0 5 -10 -5 0
⑵不考虑顺序的不重复抽样:
N! C n! ( N n)!
n N
例
5 A 254 251 200 5 50 C 50 2 118 760 ( 种) 5! 5 4 3 2 1
四、抽样调查的理论依据(p257-259,了解) 1.大数定律
(1)独立同分布大数定律 (2)贝努大数定律
2.中心极限定理(p256-257,了解)
(1)独立同分布中心极限定理 (2)德莫佛-拉普拉斯中心极限定理
第三节 抽样平均误差
一、抽样误差的概念
在统计调查中,调查资料与实际情况不一致, 两者的偏离称为统计误差。
登记误差 系统性误差 统计误差 代表性误差 实际误差 随机误差 抽样平均误差
x X
400 225 100 25 0 225 100 25 0 25 100 25 0
2
接左:
抽取样本
30 30 40 40 40 40 40 50 50 50 50 40 50 10 20 30 40 50 10 20 30 40
样本平均数 x
35 40 25 30 35 40 45 30 35 40 45
三、抽样调查的适用范围
抽样调查方法是市场经济国家在调查方法
上的必然选择,和普查相比,它具有准确度高、 成本低、速度快、应用面广等优点。
一般适用于以下范围:
(一)实际工作不可能进行全面调查观察,而又需要 了解其全面资料的事物; (二)虽可进行全面调查观察,但比较困难或并不必 要; (三)和全面调查相比较,抽样调查能节省人力、费 用和时间,而且比较灵活 (四)在有些情况下,抽样调查的结果比全面调查要 准确。 (五)对普查或全面调查统计资料的质量进行检查和 修正; (六)抽样调查方法可以用于工业生产过程中的质量 控制。 (七)利用抽样推断的方法,可以对于某种总体的假 设进行检验,判断这种假设的真伪,以决定取舍。
四、抽样平均误差的计算
(二)抽样成数的抽样平均误差 重复抽样条件下抽样成数的抽样平均误差
抽样平均误差 p
抽样平均误差 p
p (1 p) n
不重复抽样条件下抽样成数的抽样平均误差
p (1 p ) n 1 n N
四、抽样平均误差的计算
计算抽样平均误差时 和p都是全及指标, 一般未知,通常采取四种方法解决:
第二节 抽样调查的基本概念及理论依据
一、全及总体和抽样总体 (一) 全及总体,简称总体
全及总体:所要认识对象的全体。 总体单位数用N表示。 全 及总体按其单位标志性质不同分为:变 量总体和属性总体。 变量总体可以用数量标示加以计量。 属性总体用文字描写属性特征。如: 完好、非完好。
第二节 抽样调查的基本概念及理论依据
1.用过去调查所得的资料。 2.用样本方差的资料代替总体方差。 3.用小规模调查资料。 4.用估计的材料。 (三)抽样平均误差计算实例(p270-271)
例
五户家庭三月份购买某商品的支出: 10元, 20元, 30元, 40元, 50元 X 30元 现从五户中抽取二户作调查, 如果为重复抽样(考虑顺序) 52=25(种) 排列组合如下:
上例五户中抽取二户调查,如采取不考虑顺序的不重复抽 5 4 样方法,则: C 10(种10 10 20 20 20 30 30 40 合 20 30 40 50 30 40 50 40 50 50 计
样本平均数
离差
x X
-15 -10 -5 0 -5 0 5 5 10 15 -
到平均重量x 1002克,合格率p 98%,我们直接推 断全部产品的平均重量X 1002克,合格率P 98%。
1.直接换算法
抽样平均数(成数)×总体单位数=总体标志总量
1.如果采用点估计方法:上例1中:400×10000=400(万千克) 如果用区间估计方法:上例1中该农场小麦总产量的范围 为: t=2: (397.62 ~ 402.38)×10000=397.62 ~ 402.38(万千克) t=3: (396.43 ~ 403.57)×10000=396.43 ~ 403.57(万千克) 2.上例2中,全部一级品数量的范围为: (92.82% ~ 97.18%)×8000=7425.6 ~ 7774.4(件)
(一)抽样平均数的抽样平均误差
2 ( X x)
抽样平均误差 x
K
K全部可能的样本个数
1. 重复抽样条件下抽样平均数的抽样平均误差
2 抽样平均误差 x
n
n
2. 不重复抽样条件下抽样平均数的抽样平均误差
2 N n 2 n 抽样平均误差 x 1 n N 1 n N 2 N n 2 n n 当 很小时, 1 接近于 1 , 很接近。 与 N n N 1 n N
差错率
1.03
415.03 根据这一系数,再来修正工资总额,则: 年报工资总额 3218.1 (1 0.248%) 3226.09(万元)
0.248%
(二)区间估计
1.区间估计的意义
根据样本指标和抽样误差去推断全 及指标的可能范围,它能说清楚估计的 准确程度和把握程度。
以上资料编成次数分配表如下:
x
10 15
样本数f (即次数分配)
xX
-20 -15
1 2
20
25 30 35
3
4 5 4
-10
-5 0 5
40
45 50 合计
3
2 1 25
(x X) f f
2
10
15 20 -
∴抽样误差是所有可能出现的样本指标的标 准差。它是由于抽样的随机性而产生的样本 指标与总体指标之间的平均离差。
2
(二)抽样指标
抽样指标:抽样总体的那些指标。
x1 x2 ... x N 抽样平均数 x N n1 抽样成数p n 2 ( x x ) 样本方差s N 2 ( x x) 样本标准差s N
2
(三)统计抽样过程(图6-1,p255)
所谓推断,就是用抽样指标来推断全及指标。 一是用抽样平均数 x推断全及平均数 X,从而推断 总体标志总量 二是用抽样成数p推断全及成数P,从而推断总体 单位总量
x
15 20 25 30 25 30 35 35 40 45 -
x X
225 100 25 0 25 0 25 25 100 225 750
2
2 750 ( x-X ) 抽样平均误差( x ) 8.66(元) n 10
第四节 全及指标的推断
一、抽样推断要求
抽样推断就是按照已经抽定的样本指标来估 计总体指标,或其所在的区间范围。
抽样误差即指随机误差,这种误差是抽 样调查固有的误差,是无法避免的。
实际误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、 p P 。无法知道。 抽样平均误差是指所用可能出现的样本指标 的标准差。可以计算。
二、影响抽样平均误差的因素
(一) 全及总体标志变异程度。——正比关系
(二)抽样单位数目的多少。——反比关系 (三)抽样的组织方式。
2. 修正分数法
就是用抽样所得的调查结果同有关资料 对比的系数来修正全面统计资料时采用的一 种方法。
例1
某村6000农户,2005年年末统计养猪头数, 从下往上报的是9000头,现抽10%(600户)的 农户再复查一下,发现有漏报,也有重报。按 600户,原来数字是890头,实际复查为935头, 故总的来说,是少报。