概率论 常用统计分布
由中心极限定理得
n
lim P {
n
2 n n
2n
x}
x
lim P{ i 1
n
2 X i n
n
x}
1 2
t2 e 2 dt
即 2分布的极限分布是正态 分布,也即当 n
很大时,
2 n n
2n
2 服从N (0,1), 进而 n N ( n,2n).
Y12
Y22
~ 2 ( 2)
则C1 1 2 , C2 1 4 .
2. t 分布 历史上,正态分布由于其广泛的应用背景 和良好的性质,曾一度被看作是“万能分布”, 在这样的背景下,十九世纪初英国一位年轻 的酿酒化学技师Cosset. WS, 他在酒厂从事试验 数据分析工作,对数据误差有着大量感性的认 识,我们知道在总体均值和方差已知情况下, 样本均值的分布将随样本量 增大而接近正态分布,
n
x
1 2
e dt .
t2
2
2 证 由假设和定义5.6, n X i2 , 其中X 1 , X 2 ,, X n i 1
2 2 2 独立且每个X i ~ N (0,1),因而X1 , X2 ,, X n 独立同分布,
且
E( X i2 ) 1, D( X i2 ) 2 (i 1,2,, n)
(3) T的数字特征
E (T ) 0,
n D(T ) n2
( n 2).
例3 设总体X和Y相互独立, 且都服从N(0,9)
X 1 , X 2 ,, X 9和Y1 ,Y2 ,,Y9来自总体X ,Y的样本,
求统计量T的分布,其中
T Xi /
i 1 9 2 Y i. i 1 9
1. 2 分布 正态分布是自然界中最常见的一类概率 分布,例如测量的误差;人的生理尺寸:身 高,体重等都近似服从正态分布.常见的问题 是关于这些正态随机变量的平方以及平方和 的概率分布问题. 例如在统计物理中,若气体分子速度是随 机向量 V ( X ,Y , Z ) 各分量相互独立,且均服 从 N (0,1.5), 要求该分子运动动能 1 S m( X 2 Y 2 Z 2 ) 2 的分布规律.
n 1 根据 分布的可加性知 X i ~ , 2 2 i 1
2 n n 2
.
(3) 分布的性质
2
性质1 ( 分布的可加性) 设 Y1 ~ 2 ( n1 ), Y2 ~ 2 ( n2 ), 并且 Y1 , Y2 独
2
立, 则 Y1 Y2 ~ 2 ( n1 n2 ).
(1) 定义 定义5.7 设 X ~ N (0, 1), Y ~ 2 ( n), 且 X , Y
独立, 则称随机变量
X T Y /n 服从自由度为n的 t 分布, 记为 T ~ t (n).
t 分布又称学生氏 (Student)分布.
( 2) t ( n) 分布的概率密度函数为 n 1 n 1 2 t 2 2 h( t ) 1 , t n n πn y 2
2 2
又因为 X i ~ N (0, 1), 由定义 X i2 ~ 2 (1),
1 1 即 X ~ , , i 1, 2, , n. 2 2
2 i
因为X1 , X 2 ,, X n相互独立,
2 2 2 所以 X 1 , X2 , , X n 也相互独立,
2 i 1
n
( E( Xi2 ) 1 )
n n 2 2 2 D ( n ) D X i D ( X i ) 2 n. i 1 i 1
2 ~ 2 ( n), 则对任意x , 有 性质3 设 n
lim P{
n
2 n n
2n
x}
但是Cosset在实验中遇到的样本容量仅有5~6 个,在其中他发现实际数据的分布情况与 正态分布有着较大的差异. y Cosset 样本曲线
正态曲线
O
x
于是Cosset怀疑存在一个不属于正态的 其他分布,通过学习终于得到了新的密度曲线, 并在1908年以“Student”笔名发表了此项结果,
后人称此分布为“t 分布”或“学生氏”分布.
(此性质可以推广到多个随机变量的情形)
设 Yi ~ 2 ( ni ), 并且 Yi ( i 1, 2,, m ) 相互
独立, 则 Yi ~ 2 ( n1 n2 nm ).
i 1 m
性质2 ( 分布的数学期望和方差)
2
2 2 2 若 n ~ 2 ( n), 则 E ( n ) n, D ( n ) 2 n.
9X
Yi
i 1
9
~ t ( 9)2源自即T Xi
i 1 9
9
~ t (9).
2
Yi
i 1
3. F分布
(1) 定义 定义5.8 设X ~ 2 ( n1 ) ,Y ~ 2 ( n2 ), 且X ,Y相互独立,
则称随机变量
X / n1 F Y / n2
服从自由度为 ( n1 , n2 )的F分布,记为
1) N (0,1):u1 u
x O
x
x
2) t ( n) : t1 ( n) t ( n)
1) 正态分布的上侧分位数u:
设X服从标准正态分布 N (0,1), 则其上侧
分位数u 满足
1 P { X u } 2π
x2 e 2 dx u
第二节
常用统计分布
一、常见分布 二、概率分布 的分位数
下 回
停
一、常见分布
在实际中我们往往会遇到这样的问题,要求有 关随机变量的函数的概率分布. 例如在无线电接收中,某时刻接收到的信号 是一个随机变量X ,若我们把 这个信号通过平方示波器,则 输出的信号为 Y X2 通常需要求出Y的概率分布. 本节介绍一些最常见的统计分布.
F ~ F ( n1 , n2 ).
( 2) F ( n1 , n2 )分布的概率密度为
n1 n1 n1 2 2 1 n1 n2 y 2 n2 , y0 n1 n2 p( y ) 2 n n n y 1 2 1 1 2 2 n2 其它 0,
若存在x , 使
P{ X x }
则称x 为X的分布的上侧 分位数.
2. 常用分布的上侧分位数记号 分布 N(0,1)
2 ( n ) t( n )
2 ( n)
F(n1,n2)
记号
u
t (n)
F ( n1 , n2 )
3. 查表法 (1) 若X的分布密度关于y轴对称,则 y x1 x 1 特例:
n2 2
3) 设F ~ F ( n1 , n2 ), 则当n2 4时, 对任意x有
x F E(F ) 1 lim P{ x} 2π D( F ) n1
2 t e 2 dt
这说明F分布极限分布也是正态分布.
例4 已知 T ~ t ( n), 试证 T 2 ~ F (1, n). 证 因为 T ~ t ( n), 由定义5.7有
X ~ N (0,1) 解 从抽样分布知
而 Yi ~ N (0,9), 故Yi / 3 ~ N (0,1),
从而
Yi 2 2 ( ) ~ (1), i 1,2,,9. 3
由可加性知
Yi 2 2 ( 3 ) ~ ( 9) i 1
X 1 2 Yi 9 i 1
9
9
于是由t 的定义有
自由度为 n的 2分布.
自由度:
2 2 2 2 指 n X1 X2 X n 中右端包含独立
变量的个数.
2 ( 2) χ n 分布的概率分布
2 定理5.4 n 分布的概率密度:
n x 1 1 2 2 x e x0 n 2 n p( x ) 2 ( ) 2 其它 0 1 1 证 因为 2 (1) 分布即为 , 分布,
( 3) F分布有以下性质 1) 若F ~ F ( n1 , n2 ), 则 1 ~ F ( n2 , n1 ). F n2 2) E ( F ) , ( n2 2),
n2 2) D( F ) , ( n2 4) 2 n1 ( n2 2) ( n2 4)
2 2n2 ( n1
t分布的概率密度曲线如 图. 显然图形是关于 t 0 对称.
当n充分大时,其图形
n n2 n9 n2
类似于标准正态变量
概率密度的图形 .
O
x
1 因为lim h( t ) e n 2π
t2 2
,
所以当n足够大时t分布近似于N (0,1)分布,
但对于较小的n, t分布与N (0,1)分布相差很大.
同理
X 3 X 4 X 5 X 6 ~ N (0,4),
X3 X4 X5 X6 则 Y2 ~ N (0,1) 4
X3 X4 X5 X6 X1 X 2 又 Y1 与 Y2 4 2
相互独立.
X1 X 2 2 X3 X4 X5 X6 2 所以 ( ) ( ) 2 4
例1 设X ~ N (0,4),Y ~ 2 ( 2),且X ,Y相互独立,
X2 试求解 Y 的概率分布. 4
解 因为X ~ N (0,4)且 X ,Y 相互独立,所以 X ~ N (0,1) 2 2 X 且 与Y相互独立 4 2 X 又因为 ~ χ 2 (1),由可加性得 4 X2 得 Y ~ χ 2 ( 3). 4