当前位置:文档之家› 抽样的基本概念

抽样的基本概念


中心极限定理
(图示)
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从正态分布。
一个任意分 布的总体
当样本容量足够 大时(n >30) , 样本均值的抽样 分布逐渐趋于正 态分布
X
抽样平均误差
1.重复抽样条件下,记算公式为: 2.不重复抽样条件下,计算公式为:
设总体中 N 个总体单位某项标志的标志值分别
为 X1, X 2 , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N0个单位,则
⒈ 总体平均数(又叫总体均值): ⒉ 总体标准差: ⒊ 总体方差:
⒋ 总体比例: ⒌ 是非标志总体的标准差:
P P1 P 当P 0.5时, P有最大值
3.小于总体标准差 4.与样本容量的关系
抽样分布
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
x
n
X
P119例4-5
某班组有5个工人,他们的单位工时工资分别是4、6、8、10 、12元,总体服从于正态分布。现用重复抽样方式从5个工 人中抽出2人,计算样本的平均工时工资的抽样平均误差。
解:总体分布的平均数与方差分别是:
练习:计算样本比例的抽样平均误差
1、某县人口10万人,用简单随机不重复抽样 方法抽取1/10的人口进行调查,得知男性 人口比重为51%,求男性人口比重的抽样平 均误差。
2、对某乡进行简单随机重复抽样调查,抽出 100个农户进行调查,得知年收入在1800元 以上的占95%,求农户年收入在1800元以上 比重的抽样平均误差。
第4章 抽样估计
第一节 抽样的基本概念 第二节 抽样分布与中心极限定理 第三节 总体参数估计 第四节 抽样方案的设计与实施*
统计推断的过程
总体

样本统计量,

如样本均值、
样本比例、样
本标准差等
检验一批灯泡的使用寿命 节目的收视率 水库中的鱼苗数
• 抽样估计包括抽样调查和抽样推断两个部分 。
• 抽样调查是一种非全面的调查方法,是从总 体中按照随机原则抽取样本单位进行调查
⒍ 是非标志总体的方差:
P2 P1 P
指根据样本单位的标志值计算的用
样本指标 以估计和推断相应总体指标的综合
指标,又被称为估计量或统计量。
设样本中 n 个样本单位某项标志的标志值
分别为 x1, x2 , xn ,其中具有和不具有某
种属性的样本单位数目分别为 n1和 n0 个,则
n
⒈ 样本平均数(又叫样本均值): xi x i 1 n
有均等的被抽中机会
什么是抽样推断?
例1: 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。
120个 样本
测试
平均里程: 36,500公里
推断
新轮胎 平均寿命
例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制:
4.1
2.5 4.1
34.7 38.8
54
5
4.1
4.1
43.0
样本二:50.26 55
10
8.3
56
1
.8
8.3 .8
51.2 52.1
样本三:53.19 57
2
1.7
58
2
1.7
1.7 1.7
53.7 55.4
59
1
.8
.8
56.2
60
19
15.7
15.7
71.9
61
62
63
真 65
66
…13
12
⒉ 样本单位标志值的标准差:s
n
1 1
xx
2

样本单位标志值的方差:
s2
n
1 1
2
xx
当样本容量很大时,1/n,与1/(n-1)相差不大, 样本方差的公式,可以直接除以n,此时与总 体的方差计算公式一致。
sx
1 n 1
x x 2 n很大 s 1 n
2
xx
⒋ 样本成数:p n1 , q n0 1 p
总体分布
.3
.2
.1 0
1
23
总体平均数:μ 2.5 总体标准差:σ 1.25
.3 P ( x )
抽样分布
.2
.1
0
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本平均数的平均数:E(x) 2.5
样本平均数的标准差: 1.25
x
2
n
不重复抽样分布,自学
二、大数定律
大数定律表明: 如果随机变量总体存在着有限的平均数
不可能进行全面调查时
对于具有破坏性的产品质量检测只 能进行抽样调查
对某些现象进行全面调查,在经济 上不合算,在资料上未必能保证,也只 能采用抽样调查。
对于时效性要求较高的某些调查
对全面调查资料进行补充修正时
抽样估计的一般步骤
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
16个样本的均值
第一个
第二个观察值
观察值 1
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P ( x ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
样本均值的分布与总体分布的比较 (图示)
一、抽样分布举例:
【例】设一个总体,含有4个元素(个体),即总体单
位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4
。总体的均值、方差及分布如下:
总体分布
.3
总体平均数:X μ 1 2 3 4 2.5 4
.2
.1 0
1
234
总体标准差:σx2
(X X )2 N
(1 2.5)2 (2 2.5)2 (3 2.5)2 (4 2.5)2 4
一个特殊平均数,设总体单位总数目是 N,总体中有该特征的单位数是 N1 。设 X 是 0、1 变量,即:总体单位有该特征,则 X 取 1,否则取 0,则有:
p N1 X N
(4.8)
现从总体中抽出 n 个单位,如果其中有相应特征的单位数是 n1 ,则样本成数是:
P n1 n
P 也是一个随机变量,利用样本平均数分布性质的结论,有:
1.25
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表:
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
计算出各样本的均值,如下表。并给出样本 均值的抽样分布
• 抽样推断是利用样本信息推断总体的数量特 征。
• 抽样估计不论在统计调查还是在统计分析中 都有广泛的应用。
抽样调查的概念
• 广义:凡是抽取一部分单位进行观察, 并根据观察结果来推断全体的都是抽样 调查,其中又可分为非随机抽样和随机 抽样两种。
• 狭义:根据大数定律的要求,在抽取调 查单位时应保证总体中的各个单位都有 同等的中选可能性。
• 一般所讲的抽样调查,大多数是指这种 随机调查,即狭义的抽样调查。
按照随机抽样原则 抽取总体中的部分
单位进行调查,用部分单位的指标数值 作为代表,对总体的指标数值作出具有 一定可靠程度的估计与推断,从而认识 总体的一种统计方法。
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都
练习
1、对某乡进行简单重复抽样调查,抽出100个 农户,户均年收入2000元,年收入标准差 100元。
(1)求抽样平均误差。 (2)若抽取的是200户,则抽样平均误差是多
少? (3)若要使抽样平均误差降低为原来(1)的
一半,则应抽多少户。
2、对某县人口用不重复抽样方法按1/10比例抽 出1万人进行调查,得知样本平均年龄40岁 ,年龄标准差20岁,求抽样平均误差。
x 4 6 8 10 12 8(元)
N
5
2
x 2 (4 8)2 (6 8)2 (8 8)2 (10 8)2 (12 8)2
N
5
8元
抽样平均误差为:
X P 是指具有某种特征的单位在总体中的比重。在前面我们已经知道,成数是
抽样平均数和总体平均数的离差究竟有多大? 离差不超过一定范围的概率究竟有多少? 离差的分布状况怎样?
• 大数定律和正态分布没有给出任何这方面 的信息。
中心极限定理的重要意义
中心极限定理研究的是变量和的分布和 变量平均数的分布。
它论证了以下几点:
第一,如果总体很大,而且服从正态分布,则样 本平均数的分布也服从正态分布; 第二,如果总体很大,但不服从正态分布,只要
抽样方法 不重复抽样
又被称作不重置抽样、不放 回抽样
抽出 个体
登记 特征
继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
相关主题