当前位置:文档之家› 第五章 抽样与抽样分布

第五章 抽样与抽样分布


1 n lim P X i 1 n n i 1
定律表明:只要随机变量独立同分布,即 使不存在有限方差,其数学期望仍可由n 个随机变量的算术平均值作为其近似值。
6
end
二、中心极限定理
在统计学中,论证随机变量和的极限分 布是正态分布的一系列定理统称为中心 极限定理(central limit theorem)。
26
end
根据样本抽选的方法不同,可分为:
随机起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
半距起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
对称起点系统抽样
· · · · · ·
(总体单位按某一标志排序)
27
end
系统抽样的好处: 1. 可以使抽样过程大大简化,减轻抽 样的工作量; 2. 如果用有关标志排队,还可以缩小 抽样误差,提高抽样推断效果。 按有关标志排队系统抽样,实际上是 一种特殊的分层抽样。
仅适用于规模不大、内部各单位标志值差异 较小的总体
23
end
二、分层抽样
先将总体按某一标志分层,然后从各 层中按随机原则抽取样本单位组成样本。
实质上是分组法与随机原则的结合。 例如,在居民生活水平调查中,先按职业 分类,然后每种职业分别随机抽取部分居 民进行调查。
24
end
样本在各层间的分配方法:
10
end
一、分位数
设X为随机变量,对给定的概率(1>>0), 若实数F满足不等式
P{ X F }
则称F为随机变量X分布概率为的上侧分 位数。 若实数T/2满足不等式 P{| X | T 2 } 则称T/2为随机变量X分布概率为的双侧 分位数。
11
end
标准正态分布的上侧分位数
8
end
棣莫佛—拉普拉斯中心极限定理
定理表明,当n很大,np和n(1-p) (n 是试验的次数,p是试验中事件A发生 的概率)也都不太小时,二项分布可以 用正态分布去近似。
9
end
第三节 由正态分布导出的几个重要分布
由样本统计量对未知总体分布进行 推断,必须知道统计量所服从的分布。 本节介绍几个重要的常用统计量分 布:2分布,t分布, F分布。
37
end
四、样本方差的分布
1. 在重复选取容量为 n 的样本时,由样本方 差的所有可能取值形成的概率分布
2. 对于来自正态总体的简单随机样本,则比 值 ( n 1) s 2
2
的抽样分布服从自由度为 (n-1) 的 2 分布, 2 即 ( n 1) s 2

2
~ ( n 1)
南昌航空大学
1
end
第五章 抽样与抽样分布 第一节 统计量 第二节 大数定律与中心极限定理 第三节 由正态分布导出的几个重 要分布 第四节 常用的抽样方法 第五节 抽样分布
2
end
第一节 统计量
统计量(statistic):描述样本特征的 概括性数字度量,根据样本数据计算的一 个随机变量,是对总体分布特征推断的 工具。
一、抽样分布概念 样本统计量取值的概率分布,叫抽样 分布(sampling distribution)。 是推断统计中用样本推断总体时的重 要理论依据。
31
end
二、样本均值的分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的概率分布
2. 推断总体均值的理论基础
32
end
总体服从正态分布 N(μ,σ2) ,该总体的任何容 量的样本均值 x 也服从正态分布, x 的期望 值为μ,方差为σ2/n。即x ~N(μ,σ2/n)
28
end
四、整群抽样
将总体全部单位分为若干“群”,然后以群 作为抽样单位,从总体中抽取若干群作为样 本,并对中选群的所有单位进行全面调查。 例:总体群数R=16
A E I M B F J N C G K O D H L P
样本群数r=4 样本容量
D P I H
n nd n p ni nh
对总体未作任何处理,按随机原则直接从总 体中抽出若干单位构成样本. 抽取样本的具体方法: 直接抽选法 抽签法:将总体中每个单位的编号写在外形完全 一致的签上,将其搅拌均匀,从中任意抽选, 签上的号码所对应的单位就是样本单位。 随机数表法:将总体中每个单位编上号码,然 后使用随机数表,查出所要抽取的调查单位。
设X1, X2, …Xn为总体X的样本,如果 样本的函数g(X1, X2, …Xn)是一个随机 变量,并且不包含任何未知参数,则 称g(X1, X2, …Xn)为统计量。
3
end
几个常用的统计量:
n 1 1. 样本均值: X X i n i 1
n 1 2 2. 样本方差: S 2 (Xi X ) n 1 i 1
X m F Y n
服从自由度m和n的F分布,记为
F ~ F ( m , n)
20
end
不同自由度的F分布
(1,10)
(5,10) (10,10)
F
右偏分布
21
end
第四节 常用的抽样方法
通常有以下几种抽样方法: 简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样
22
end
一、简单随机抽样
end
t分布的性质:
(1)与正态分布一样,是对称的,但比正 态分布要平一些。 (2)自由度充分大时,t分布近似于正态分 布。自由度趋向无穷大时,t分布就是标准 正态分布。
(3)t分布的均值为0,其方差为n/(n-2)。
19
end
F-分布 (F(n), 且X与Y相互独立, 则称
3.样本标准差:
S
1 2 ( X X ) i n 1 i 1
4
end
n
第二节
大数定律与中心极限定理
一、大数定律
大数定律(laws of large numbers) 也称大数法则,它是阐述大量同类随机现 象的平均结果稳定性的规律。
5
end
辛钦大数定理
设随机变量X1, X2, …Xn相互独立,服 从同一分布,且具有数学期望 EXi=(i=1,2,…n) 则对任意0,有
38
end
=10
x 5
n=4
x 2.5
n =16
= 50
总体分布
X
x 50
抽样分布
x
33
end
从均值为,方差为2的一个任意总体中抽取 容量为n的样本,当n(30)充分大时,样本均 值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布
任意 分布 的总 体
x n
2
14
end
不同自由度的2-分布
n=1 n=4 n=10
2
15
end
2-分布性质和特点
1. 变量值始终为正 2. 通常为不对称的右偏分布,随着自由度的 增大逐渐趋于对称 3.期望E(2)=n,方差D(2)=2n(n为自由度) 4. 可加性:若 U 和 V 为两个独立的 2 分布随机 变量,U~2(n1),V~2(n2), 则U+V服从自由度为n1+n2的2分布

0
Z
Z
12
end
标准正态分布的双侧分位数
/ 2
-Z/2
0
/ 2
Z/2
Z
13
end
2-分布 (2-distribution)
设 X1 , X2 , ……Xn 是取自标准正态总 体的样本 ,则随机变量
X
2 i 1
n
2 i
服从具有n个自由度的2分布,记为
~ ( n)
7
end
X
i 1
独立同分布中心极限定理 设X1, X2, …Xn是独立同分布的随机变量序 列,且存在有限的数学期望EXi=和方 差DXi=2 (i=1,2,…n) ,那么当n时 n,
i
~ N ( n , n ) 或X ~ N ( ,
2
2
n)
中心极限定理为均值的抽样推断奠定了理论 基础。不论总体服从何种分布,只要期 望和方差存在,对这一总体进行重复抽 样,当样本量充分大,样本均值就趋于 正态分布。
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
29
end
五、多阶段抽样 某公司要进行全国性的产品售后服务满意度 调查时,通常是先抽几个省,然后从抽中的 省中抽取若干个城市,从抽中的城市中,再 抽取若干个县、村,最后再抽到户,这种抽 样方式就是多阶段抽样。
30
end
第五节 抽样分布
等比例分配法:按各层单位的比例分配样 本单位。
类型抽样的优点: 能提高样本的代表性; 组织起来较为方便;
25
end
三、系统抽样
先将总体各单位按某一标志排队,然后按固 定的顺序和间隔抽取样本单位。又称机械抽 样或等距抽样。
系统抽样是不重复抽样,适合于对单位数不 多且能进行排序的总体抽样。 排序和所研究标志数值大小无关。 按无关标 志排队 如调查居民生活水平时,按姓氏笔 划排队。 按有关标 排序和所研究标志数值大小有密切 志排队 关系。如居民收入调查,按银行存 款多少排序。
n0 p n
n1 或 1 p n
36
end
样本比例的分布
1. 在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的概率分布 2. 当样本容量很大时(np≥5和 n(1p)≥5) ,样本比例的抽样分布可用正态分 布近似,即 3.
(1 ) p ~ N , n
样本均值 的抽样分 布趋于正 态分布
相关主题