当前位置:文档之家› 抽样的基本概念

抽样的基本概念


一个特殊平均数,设总体单位总数目是 N,总体中有该特征的单位数是 N1 。设 X 是 0、1 变量,即:总体单位有该特征,则 X 取 1,否则取 0,则有:
p N1 X N
(4.8)
现从总体中抽出 n 个单位,如果其中有相应特征的单位数是 n1 ,则样本成数是:
P n1 n
P 也是一个随机变量,利用样本平均数分布性质的结论,有:
总体分布
.3
.2
.1 0
1
23
总体平均数:μ 2.5 总体标准差:σ 1.25
.3 P ( x )
抽样分布
.2
.1
0
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本平均数的平均数:E(x) 2.5
样本平均数的标准差: 1.25
x
2
n
不重复抽样分布,自学
二、大数定律
大数定律表明: 如果随机变量总体存在着有限的平均数
抽样方法 不重复抽样
又被称作不重置抽样、不放 回抽样
抽出 个体
登记 特征
继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
第4章 抽样估计
第一节 抽样的基本概念 第二节 抽样分布与中心极限定理 第三节 总体参数估计 第四节 抽样方案的设计与实施*
练习
1、对某乡进行简单重复抽样调查,抽出100个 农户,户均年收入2000元,年收入标准差 100元。
(1)求抽样平均误差。 (2)若抽取的是200户,则抽样平均误差是多
少? (3)若要使抽样平均误差降低为原来(1)的
一半,则应抽多少户。
2、对某县人口用不重复抽样方法按1/10比例抽 出1万人进行调查,得知样本平均年龄40岁 ,年龄标准差20岁,求抽样平均误差。
抽样平均数和总体平均数的离差究竟有多大? 离差不超过一定范围的概率究竟有多少? 离差的分布状况怎样?
• 大数定律和正态分布没有给出任何这方面 的信息。
中心极限定理的重要意义
中心极限定理研究的是变量和的分布和 变量平均数的分布。
它论证了以下几点:
第一,如果总体很大,而且服从正态分布,则样 本平均数的分布也服从正态分布; 第二,如果总体很大,但不服从正态分布,只要
计 算 样 本 统 计 量
推 断 总 体 参 数
第六章 抽样与参数估计
第一节 第二节 第三节 第四节
抽样调查的含义 抽样调查的基本概念 抽样调查的数理基础 抽样推断的方法
第二节 抽样调查的基本概念
★• 一、全及总体和样本总体 • 二、全及指标和样本指标 • 三、抽样方法和样本可能数目
全及总体
研究对象的全体,即第一章中学 过的总体。
400个 样本
支持人数: 160
推断
支持该候选人 的选民占全部
选民的比例
抽样调查的基本特点:
非全面调查
目的是推断总体的数量特征,抽样 推断结果具有一定的可靠程度
抽样调查中的抽样误差是不可避免 的,但在事先是可以计算并加以控制 的
节省调查费 调查速度快 调查结果准确可靠 应用范围广
抽样调查的作用,书P112-113
样本足够大( n≥30 ),样本平均数的分布也趋
近于正态分布。 第三,样本平均数分布的平均数,等于总体的平 均数。
中心极限定理的重要意义
• 第四,样本分布的标准差为: • 这是在有限总体场合下使用的公式,其中:
N n
N 1 ,称为修正因子。 • 当N趋向于无穷大时,其值趋近于1,在允许重
复抽样的条件下,总体在任何时候都成为无限总 体,这时:
设总体中 N 个总体单位某项标志的标志值分别
为 X1, X 2 , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N0个单位,则
⒈ 总体平均数(又叫总体均值): ⒉ 总体标准差: ⒊ 总体方差:
⒋ 总体比例: ⒌ 是非标志总体的标准差:
P P1 P 当P 0.5时, P有最大值
⒍ 是非标志总体的方差:
P2 P1 P
指根据样本单位的标志值计算的用
样本指标 以估计和推断相应总体指标的综合
指标,又被称为估计量或统计量。
设样本中 n 个样本单位某项标志的标志值
分别为 x1, x2 , xn ,其中具有和不具有某
种属性的样本单位数目分别为 n1和 n0 个,则
n
⒈ 样本平均数(又叫样本均值): xi x i 1 n
3.小于总体标准差 4.与样本容量的关系
抽样分布
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
x
n
X
P119例4-5
某班组有5个工人,他们的单位工时工资分别是4、6、8、10 、12元,总体服从于正态分布。现用重复抽样方式从5个工 人中抽出2人,计算样本的平均工时工资的抽样平均误差。
解:总体分布的平均数与方差分别是:
10.7 9.9
2
1.7
值:51.18 4
3.3
1
.8
10.7 9.9 1.7 3.3 .8
82.6 92.6 94.2 97.5 98.3
67
2
1.7
1.7
100.0
Total
121
100.0
100.0
抽样方法
重复抽样 又被称作重置抽样、有放回抽样
抽出 个体
登记 特征
放回 总体
继续 抽取
特点 同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
1
.8
.8
4.1
20人组成样本并计算平 43
3
2.5
2.5
45
5
4.1
4.1
6.6 10.7
46 47
均体重: 1
.8
2
1.7
ห้องสมุดไป่ตู้
.8 1.7
11.6 13.2
48
1
.8
.8
14.0
49
3
2.5
2.5
16.5
50
16
13.2
13.2
29.8
51
3
2.5
2.5
32.2
样本一:52.35 52
3
2.5
53
5
练习:计算样本比例的抽样平均误差
1、某县人口10万人,用简单随机不重复抽样 方法抽取1/10的人口进行调查,得知男性 人口比重为51%,求男性人口比重的抽样平 均误差。
2、对某乡进行简单随机重复抽样调查,抽出 100个农户进行调查,得知年收入在1800元 以上的占95%,求农户年收入在1800元以上 比重的抽样平均误差。
• 一般所讲的抽样调查,大多数是指这种 随机调查,即狭义的抽样调查。
按照随机抽样原则 抽取总体中的部分
单位进行调查,用部分单位的指标数值 作为代表,对总体的指标数值作出具有 一定可靠程度的估计与推断,从而认识 总体的一种统计方法。
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都
x 4 6 8 10 12 8(元)
N
5
2
x 2 (4 8)2 (6 8)2 (8 8)2 (10 8)2 (12 8)2
N
5
8元
抽样平均误差为:
X
n
8 2元
2
样本成数分布
总体成数 P 是指具有某种特征的单位在总体中的比重。在前面我们已经知道,成数是
1.25
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表:
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
计算出各样本的均值,如下表。并给出样本 均值的抽样分布
16个样本的均值
第一个
第二个观察值
观察值 1
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
样本均值的分布与总体分布的比较 (图示)
E(P) p
(4.9) (4.10)
(P)
p(1 p)
p(1 p)
n
n
(4.11)
P120例4-6
已知一批产品的合格率为90%,现采用重复抽样方式从 中取出400件,求样本合格率的抽样平均误差。
解: E(P) p 90%
(P) p(1 p) 0.9 0.1 1.5%
n
400
由于样本容量大,样本成数的平均误差就大大减小。
4.1
2.5 4.1
34.7 38.8
54
5
4.1
4.1
43.0
样本二:50.26 55
10
8.3
56
1
.8
8.3 .8
51.2 52.1
样本三:53.19 57
2
1.7
58
2
1.7
1.7 1.7
53.7 55.4
59
1
.8
.8
相关主题