当前位置:文档之家› 概率论与数理统计 第5章 大数定律和中心极限定理

概率论与数理统计 第5章 大数定律和中心极限定理


5.1 大 数 定 律 作为上述定理得特殊情况,可以得到如下重要定 理: 定理 5.3 (伯努利大数定律)设 nA 是 n 重伯努利试 验中事件 A 发生的次数, p 是事件 A 在每次试验中 发生的概率,则对于任意正数,有
nA P nA 即 (5.4) p ( n ) limP p 1 n n n
第五章 大数定律和中心极限定理 【吸烟率调查问题】 某卫生组织为确定某城市成年男子的吸烟率p,将 被调查的成年男子中吸烟的频率作为p的估计,现在 要保证有 90% 以上的把握,使得调查对象吸烟者的
频率与该城市成年男子的吸烟率p之间的差异不大于
5%,问至少要调查多少对象?
5.1
大 数定 律
对某个随机变量 X进行大量的重复观测,所得到 的大批观测数据的算术平均值也具有稳定性,由于 这类稳定性都是在对随机变量进行大量重复试验的 条件下呈现出来的,历史上把这种试验次数很大时 出现的规律统称为大数定律.
即对于任意正数,有
1 n limP X i 1 n n i 1
1 n P X (n ) 也即 (5.3) i n i 1 n n 1 1 1 证:因为 E ( X i ) E ( X i ) n n n i 1 n i 1 1 n 1 D( X i ) 2 n i 1 n
nA p 实际上几乎是必定要发生的,即对于给 n
用事件发生的频率来近似地代替事件发生的概率.
5.1 大 数 定 律 上 述 契 比 谢 夫 大 数 定 律 中 要 求 随 机 变 量 X1 , X2 , … , Xn , … 的方差存在,实际上,在高等概率
论中已经证明了在不要求D(Xi)(i = 1,2,…)存在
证:引入随机变量Xi(i = 1,2,…,n): A发生 1, 第i次试验中 Xi A不发生 0, 第i次试验中
5.1 大 数 定 律 则
nA X1 X 2 X n ~ B( n, p)
其中 X1 , X 2 , , X n 相互独立且均服从参数为p的0-1分 布,即
P{ X i 1} p, P{ X i 0} 1 p, i 1,2,...,n
且有
E(Xi) = p,D(Xi) = p(1 – p),i = 1,2,…,n
由定理5.2得到
1 n limP X i p 1 n n i 1
5.1 大 数 定 律 由定理5.2得到
5.1 大 数 定 律 利用契比谢夫不等式,我们可以在随机变量X的分 布未知的情况下估算概率值的界限,当然这个估计
是比较保守的.如果已经知道随机变量的分布,所
需求的概率可以确切地计算出来,就没必要利用契
比谢夫不等式来做估计了.
5.1 大 数 定 律 【例5-1】若某班某次考试的平均分为 80分,标准差 为10,试估计及格率至少为多少?
的条件下,(5.3)式仍然成立.即有如下定理:
定理5.4(辛钦大数定律)设X1,X2,…,Xn,… 是相互独立,服从同一的分布的随机变量序列, 1 n 且具有数学期望E(Xi) = (i = 1,2,…),则 X i
依概率收敛于,即
p 1 n X i ( n ) n i 1
n 1 k k > 1),则 P 令 Ak X i( Ak k , (n ) n i 1
证:因为X1,X2,…,Xn独立同分布,
k 所以 X1k , X2k ,..., Xn 独立同分布。
又 E( Xik ) =k存在,由辛钦大数定律:
1 n k P Ak X i k n i 1
够大时,可以 这样做的好处是不必去管X的分布究竟是怎样的,我 们的目的只是寻求随机变量的数学期望.这一思想 方法将被应用于第七章中讲述的参数的点估计理论
1 n Xi n i 1
把的观察值作为E(X)的近似值,
中,辛钦大数定律是数理统计部分中点估计理论的
重要依据.
5.1 大 数 定 律 【例5-3】设随机变量X1,X2,…,Xn独立同分布, k 且 = E( X )(i = 1,2,…,n)存在, ik
0.76之间的概率不低于0.90?
解: 设需做n次试验,其中成功的次数为X,
则X~B(n,p),E(X) = np,D(X) = np(1 – p)。
因为
X X P{0.74 0.76} P{| 0.75 | 0.01} n n
根据契比谢夫不等式应有
X 1 D( ) np(1 p) 2 X n 1 n P{0.74 0.76} 1 n 0.012 0.012
第5章 大数定律和中心极限定理
5.2
中心极限定理
大数定律讨论的是多个随机变量的算术平均的渐 近性质.现在我们来讨论独立随机变量和的极限分 布.先给出一个例子.
5.2 中心极限定理
【例 5-4】误差分析是人们经常遇到且感兴趣的随 机变量,大量的研究表明,误差是由大量微小的相 互独立的随机因素叠加而成的.现在考虑一位操作 工在机床上加工机械轴,要求其直径应符合规定要 求,但加工后的机械轴与规定要求总会有一定误差, 这是因为在加工时受到一些随机因素的影响,它们 是: (1) 在机床方面有机床振动与转速的影响; (2) 在刀具方面有装配与磨损的影响;
1 n limP X i p 1 n n i 1

nA limP p 1 n n
nA P p ( n ) n
也即
5.1 大 数 定 律 伯努利大数定律表明,事件 A 发生的频率 nA/n 当 n 很大时依概率收敛于事件 A发生的概率 p.也就是说
对于任意正数 ,只要重复独立试验的次数 n 充分大,
事件
定的任意小的正数 ,在 n 充分大时,事件“ nA/n 与
概率p的偏差小于”实际上几乎是必定要发生 的.这也正是在大量重复独立试验中,频率 nA/n 接 近于概率p的真正含义,也就是我们所说的频率稳定 性的真正含义.所以当试验次数很大时,就可以利
5.1 大 数 定 律 首先来引进证明大数定律所需要的预备知识 —— 契比谢夫(Chebyshev)不等式. 定理5.1 设随机变量X的数学期望E(X)及方差D(X) 都存在,则对于任意正数,有不等式
P{| X E ( X ) | } D( X )


2
(5.1)
P{| X E ( X ) | } 1
5.1 大 数 定 律 定理 5.2 表明,当 n 充分大时,随机变量序列的算 术平均值接近于数学期望 E(Xi) = ,这种接近是概
率意义下的接近.通俗地说,在定理的条件下,n个
相互独立同分布随机变量的算术平均值,当n无限增
大时,几乎变成了一个常数.这一定理从理论上说
明了大量观测值的算术平均具有稳定性,为实际应 用提供了理论依据.例如,在进行精密测量时,人 们为了提高测量的精度,往往要进行若干次重复测 量,然后取测量结果的算术平均值.
第5章 大数定律和中心极限定理
5.1 大数定律 5.2 中心极限定理
第5章 大数定律和中心极限定理
人们在长期的实践中发现,事件发生的频率具 有稳定性,也就是说随着试验次数的增多,事件发
生的频率将稳定在一个确定的常数,即概率值附
近.频率的稳定性是概率定义的客观基础,在第一 章中我们从直观上描述了这一事实。本章将用大数 定律对频率的稳定性作出理论上的说明.
由于这些因素很多,每个因素对加工精度的影响 都是很微小的,而且每个因素的出现又都是人们无
法控制的、随机的、时有时无、时正时负的.这些
因素的综合影响最终使每个机械轴的直径产生误差,
若将这个误差记为 Yn ,那么 Yn 是随机变量,且可以
将 Yn 看作很多微小的随机波动 X1 , X2 , … , Xn 之和, 即Yn = X1 + X2 +…+ Xn,这里n是很大的,那么我们 关心的是,当时,Yn的分布是什么?
第五章 大数定律和中心极限定理 另外,在前面,我们还看到相互独立的正态随机变 量的和仍是正态随机变量,本章将要介绍的中心极
限定理将给出概率论中的另一个重要结果,即在相
当一般的条件下,充分多个相互独立的非正态随机
变量(不管它们的分布如何)的和近似服从正态分
布.这一事实更说明了正态分布的重要性. 大数定律和中心极限定理无论在应用上还是理论 上都具有极其重要的作用.
D( X )

2
(5.2)
成立. 称上述不等式为契比谢夫(Chebyshev)不等式.
5.1 大 数 定 律
证:(仅对连续型随机变量进行证明) 设f (x)为X的概率密度,记E(X) = ,D(X) = 2, 2 ( x ) 则 P{| X E ( X ) | } f ( x )dx f ( x )dx 2 x x
解:用随机变量X表示学生成绩,则数学期望E(X)
= 80,方差D(X) = 100,所以
P{60 X 100} P{60 < X < 100}
= P{|X – 80| < 20}
100 1 0.75 75% 2 ( 20)
所以及格率至少为75%.
§5.1 大 数 定 律 【例5-2】已知n重伯努利试验中参数p = 0.75,问至 少应做多少次试验,才能使试验成功的频率在0.74和
5.1 大 数 定 律 令
1 np(1 p) 2 1 n 0.90 2 0.01
p(1 p) 0.75 0.25 n 18750 2 2 0.1 0.01 0.1 0.01
解得
所以至少应做18750次试验.
5.1 大 数 定 律
相关主题