当前位置：文档之家› 统计学原理第六章抽样调查

统计学原理第六章抽样调查

三、抽样平均误差的意义
1. 在于说明样本指标的代表性大小。误差大，则样本指标代表性低；误差小，则样本指标代表性高；误差等于0，则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的一般范围。 3. 确定抽样单位数多少的计算依据。
四、抽样平均误差的计算
抽样平均误差实际上是样本指标的标准差。通常用μ表示。
x p
抽样误差范围的实际意义是要求被估计的全及指标 X 或P落在抽样指标一定范围内，即
落在 x x 或 p p 的范围内。
3.可信程度抽样极限误差△=tμ，（t为概率度）
可见，抽样极限误差，即扩大或缩小了以后的抽样误差范围。
例
n N n
5
(2)不考虑顺序的重复抽样：D C
n N
n N n 1
2. 如果是不重复抽样：
⑴考虑顺序的不重复抽样：
N! A N ( N 1)( N 2)( N n 1) ( N n)!
n N
例
5 A50 50 49 48 47 46 254 251 200 ( 种)
935 890 45(头) 差错率 45 890 可用5.06%的系数来修正6000农户养猪头数，即： 9000 (1 5.06%) 9455(头) 5.06%
例2
某市房地局，年报工资总额3218.1万元。现抽查14个单位：年报：415.03万元多报：0.44万元少报：1.47万元抵冲后 1.47-0.44=1.03(万元)
三、抽样方法和样本可能数目抽样方法
根据取样的方式不同，抽样方式分为：重复抽样和不重复抽样。根据对样本的要求不同，抽样方式分为：考虑顺序抽样和不考虑顺序抽样。
样本可能数目（p256-257，了解）
1. 如果是重复抽样：
(1)考虑顺序的重复抽样：B N (样本种数) 例 50 312,500,000种
抽取样本
10 10 10 10 10 20 20 20 20 20 30 30 30 10 20 30 40 50 10 20 30 40 50 10 20 30
样本平均数 x 误差 x X
10 15 20 25 30 15 20 25 30 35 20 25 30 -20 -15 -10 -5 0 -15 -10 -5 0 5 -10 -5 0
⑵不考虑顺序的不重复抽样：
N! C n! ( N n)!
n N
例
5 A 254 251 200 5 50 C 50 2 118 760 ( 种) 5! 5 4 3 2 1
四、抽样调查的理论依据（p257-259，了解） 1.大数定律
（1）独立同分布大数定律（2）贝努大数定律
2.中心极限定理（p256-257，了解）
（1）独立同分布中心极限定理（2）德莫佛-拉普拉斯中心极限定理
第三节抽样平均误差
一、抽样误差的概念
在统计调查中，调查资料与实际情况不一致，两者的偏离称为统计误差。
登记误差系统性误差统计误差代表性误差实际误差随机误差抽样平均误差
x X
400 225 100 25 0 225 100 25 0 25 100 25 0
2
接左：
抽取样本
30 30 40 40 40 40 40 50 50 50 50 40 50 10 20 30 40 50 10 20 30 40
样本平均数 x
35 40 25 30 35 40 45 30 35 40 45
三、抽样调查的适用范围
抽样调查方法是市场经济国家在调查方法
上的必然选择，和普查相比，它具有准确度高、成本低、速度快、应用面广等优点。
一般适用于以下范围：
（一）实际工作不可能进行全面调查观察，而又需要了解其全面资料的事物；（二）虽可进行全面调查观察，但比较困难或并不必要；（三）和全面调查相比较，抽样调查能节省人力、费用和时间，而且比较灵活（四）在有些情况下，抽样调查的结果比全面调查要准确。（五）对普查或全面调查统计资料的质量进行检查和修正；（六）抽样调查方法可以用于工业生产过程中的质量控制。（七）利用抽样推断的方法，可以对于某种总体的假设进行检验，判断这种假设的真伪，以决定取舍。
四、抽样平均误差的计算
（二）抽样成数的抽样平均误差重复抽样条件下抽样成数的抽样平均误差
抽样平均误差 p
抽样平均误差 p
p (1 p) n
不重复抽样条件下抽样成数的抽样平均误差
p (1 p ) n 1 n N
四、抽样平均误差的计算
计算抽样平均误差时和p都是全及指标，一般未知，通常采取四种方法解决：
第二节抽样调查的基本概念及理论依据
一、全及总体和抽样总体 (一) 全及总体，简称总体
全及总体：所要认识对象的全体。总体单位数用N表示。全及总体按其单位标志性质不同分为：变量总体和属性总体。变量总体可以用数量标示加以计量。属性总体用文字描写属性特征。如：完好、非完好。
第二节抽样调查的基本概念及理论依据
1.用过去调查所得的资料。 2.用样本方差的资料代替总体方差。 3.用小规模调查资料。 4.用估计的材料。（三）抽样平均误差计算实例（p270-271）
例
五户家庭三月份购买某商品的支出： 10元， 20元， 30元， 40元， 50元 X 30元现从五户中抽取二户作调查，如果为重复抽样(考虑顺序) 52＝25(种) 排列组合如下：
上例五户中抽取二户调查，如采取不考虑顺序的不重复抽 5 4 样方法，则： C 10(种10 10 20 20 20 30 30 40 合 20 30 40 50 30 40 50 40 50 50 计
样本平均数
离差
x X
-15 -10 -5 0 -5 0 5 5 10 15 -
到平均重量x 1002克，合格率p 98%，我们直接推断全部产品的平均重量X 1002克，合格率P 98%。
1.直接换算法
抽样平均数(成数)×总体单位数=总体标志总量
1.如果采用点估计方法：上例1中：400×10000=400(万千克) 如果用区间估计方法：上例1中该农场小麦总产量的范围为： t=2: (397.62 ～ 402.38)×10000=397.62 ～ 402.38(万千克) t=3: (396.43 ～ 403.57)×10000=396.43 ～ 403.57(万千克) 2.上例2中，全部一级品数量的范围为： (92.82% ～ 97.18%)×8000=7425.6 ～ 7774.4(件)
（一）抽样平均数的抽样平均误差
2 ( X x)
抽样平均误差 x
K
K全部可能的样本个数
1. 重复抽样条件下抽样平均数的抽样平均误差
2 抽样平均误差 x
n
n
2. 不重复抽样条件下抽样平均数的抽样平均误差
2 N n 2 n 抽样平均误差 x 1 n N 1 n N 2 N n 2 n n 当很小时， 1 接近于 1 ，很接近。与 N n N 1 n N
差错率
1.03
415.03 根据这一系数，再来修正工资总额，则：年报工资总额 3218.1 (1 0.248%) 3226.09(万元)
0.248%
(二)区间估计
1.区间估计的意义
根据样本指标和抽样误差去推断全及指标的可能范围，它能说清楚估计的准确程度和把握程度。
以上资料编成次数分配表如下：
x
10 15
样本数f (即次数分配)
xX
-20 -15
1 2
20
25 30 35
3
4 5 4
-10
-5 0 5
40
45 50 合计
3
2 1 25
(x X) f f
2
10
15 20 -

∴抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。
2
（二）抽样指标
抽样指标：抽样总体的那些指标。
x1 x2 ... x N 抽样平均数 x N n1 抽样成数p n 2 ( x x ) 样本方差s N 2 ( x x) 样本标准差s N
2
（三）统计抽样过程（图6-1，p255）
所谓推断，就是用抽样指标来推断全及指标。一是用抽样平均数 x推断全及平均数 X，从而推断总体标志总量二是用抽样成数p推断全及成数P，从而推断总体单位总量
x
15 20 25 30 25 30 35 35 40 45 -
x X
225 100 25 0 25 0 25 25 100 225 750
2
2 750 ( x-X ) 抽样平均误差( x ) 8.66(元) n 10
第四节全及指标的推断
一、抽样推断要求
抽样推断就是按照已经抽定的样本指标来估计总体指标，或其所在的区间范围。
抽样误差即指随机误差，这种误差是抽样调查固有的误差，是无法避免的。
实际误差就是指样本指标和总体指标之间数量上的差别，即 x X 、 p P 。无法知道。抽样平均误差是指所用可能出现的样本指标的标准差。可以计算。
二、影响抽样平均误差的因素
（一）全及总体标志变异程度。——正比关系
（二）抽样单位数目的多少。——反比关系（三）抽样的组织方式。
2. 修正分数法
就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。
例1
某村6000农户，2005年年末统计养猪头数，从下往上报的是9000头，现抽10％(600户)的农户再复查一下，发现有漏报，也有重报。按 600户，原来数字是890头，实际复查为935头，故总的来说，是少报。

e商务文档

统计学原理第六章抽样调查

相关文档推荐：