统计量的分布
3准则
X~N(,2)
X的取值几乎都落入以为中心,以3为半径 的区间内。这是因为:
P 3 X 3 ( 3 ) ( 3 )
( 3 ) [ 1 ( 3 ) ] 2 ( 3 ) 1 0 . 9 9 7 4
F(x) 0.9974
X3
是小概率事件
3
3
概率分布的分位数(分位点)
2
(n1)
X Sn T~t(n1)
定理3 设(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2) 分别
t 分布的数学期望与方差
设T~t (n),则E(T)=0,D(T)= nn2. (n2)
定理2
设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则统计量
TX~t(n1)
Sn
证 由于 X 与S 2相互独立,且
UXn ~ N(0,1),
(n1)S2
2
~2(n1)
由定义得
X
n
(n1)S2
的一个样本, 则称统计量 2X1 2X2 2LXn 2服从自
由度为n的 2 分布,记作 2 ~ 2(n)
自由度是指独立随机变量的个数, df n
2 ( n ) 分布的密度函数为
f
(y)
2n
1
2n
2
yn
e 21 y
2,
y0
0,
y0
(n1)n!
2 ( n ) 分布密度函数的图形
f(y)
0.5 0.4
解 成绩X服从 N ,2
PX90120.0228 PX60830.1588
526
526
录取率为 155 0.2947
526
可得 P X 9 0 1 9 0 1 0 .0 2 2 8 0 .9 7 7 2
PX60 600.1588
得
6010.15880.8412
查表得 90 2.0
定义 对总体X和给定的 (0<<1),若存在x,
使P{X≥x} =, 则称x为X分布的上侧分位数或
上侧临界值. 如图.
y
P{X≥x} =
x f(x)dx
o
x x
y
若存在数1、2,使
P{X≥1}=P{X≤2}
2
则称1、2为X分布的双
2
2 o
侧分位数或双侧临界值.
x
1
2
2
1 x
x 2
双侧 分位数或双侧临界值的特例
则
Xi
~
N(0,1)且各
X
i
相互独立,
由定义得
n
2i n1Xi2i1(X i2)2~2(n).
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
(1)式的自由度为什么是n-1?
Distribution Function 分布函数的定义
设X为一随机变量,则对任意实数x, (X<x)是一个随机事件,称
F(x)P(Xx)
为随机变量X的分布函数
F(x)是一个普
通的函数!
定义域为 (-∞,+∞); 值域为 [0,1]。
分布函数表示事件的概率
引进分布函数F(x)后,事件的概率都 可以用F(x)的函数值来表示。
n=1
0.3
0.2 n=4
0.1
n=10
0 1 3 5 7 9 11 13 15 17 x
图
其图形随自由度的 不同而有所改变.
P2(n ) 2(n )
2分布表
2分布的上分位数
满足
的数
P 2 ( n )为2 (n 2)分 布的 2 (n )f (y) 2 (n )f(y )d y
上分位数或上侧临界值,
n
从表面上看, (X i X )2是n个正态随机变量 X i X 的平方和, i1
但实际上它们不是独立的, 它们之间有一种线性约束关系:
=0 n
n
(Xi X)Xi nX
i1
i1
这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下
的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1
项是独立的.所以(1)式的自由度是n-1.
b
P{axb}a f(x)dx
则称X为连续型随机变量, f (x) 称为X 的概 率密度函数,简称概率密度或密度函数.
x
分布函数 F(x) f (t)dt
密度函数在区间上的积分 = 随机变量在区间上取值的概率
P {x1Xx2}xx 12 f(x)dx
x1
x2
概率密度函数的性质 非负性
统计量的分布称为抽样分布。
由于正态总体是最常见的总体,因此主要讨论正态 总体下的抽样分布。
由于这些抽样分布的论证要用到较多的数学知识, 故在本节中,主要给出有关结论。
概率密度函数
Probability density function p.d.f.
定义 设X为一随机变量,若存在非负实函数 f (x) , 使对任意实数 a < b ,有
或双侧临界值. 见图.
2
(
n
)
为 2分布的上2
显然, 分位数.
2
2
2
2 1
2
(
n
)
为
2分布的上1
2
O
分位数.
2 1
2
(
n
)
2
2(n )
x
如当n=8, =0.05时,
122(n)02.975(8)2.18
2(n)02.025(8) 17.53 2
2分布的数学期望与方差
设 2~ 2(n),则E( 2)=n,D( 2)=2n.
P(X<b)=F(b) P(X≥b)=1﹣ P(X<b)=1 - F(b) P(a≤X<b)=F(b) ﹣ F(a) P(a≤X<b)=P(X < b)-P(X<a)= F(b)- F(a)
密度函数和分布函数的关系 积分关系
x
F(x) f(x)dx
x
F(x)P{Xx} f (x)dx
查表 x 0 时 , (x ) 的 值 可 以 查 表
x 0 时 , ( x ) 1 (x )
例 X ~N(0,1)
P ( 1X2) ( 2 ) ( 1 ) 0 . 9 7 7 2 0 . 8 4 1 3 0 . 1 3 5 9 P (X1) ( 1 ) 1 ( 1 ) 1 0 . 8 4 1 3 0 . 1 5 8 7
2分布的可加性
设 1 2~2 (n 1 ),
2 2~2 (n 2),
且
12 ,
2 2
相互独立,
则 122 2~2(n1n2)
性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2)
n
(Xi )2
的样本,则 i1 2
~ 2(n)
证明 由已知,有
Xi~N( , 2)且X1,X2,…,Xn相互独立,
1y
2
中间高 两边低
-
+ x
对称性 单调性 拐点
关于 x = 对称
(- ,)升,(,+ )降
(,
1
1
e 2);
2
f最大 ()
1
2
μ,σ对密度曲线的影响
1
1 21 1 22
相同,不同
图形相似,位置平移
2
1 0.75 2 1.25
不同,相同 越小,图形越陡; 越大,图形越平缓
随机变量的分布函数
f(x) 0 , x ( , )
规范性
f (x)
f (x)dx 1
P { x }1
正态分布 Normal Distribution
若连续型随机变量X的概率密度为
f(x) 1
(x)2
e22
2
,(0)为 常 数
则称X服从参数为 ,2 正 态 分 布 , 记 为
X ~N(,2)
正态分布的密度函数的性质与图形
定理 设(X1,X2,…,Xn)为来自正态总体
X~N( , 2)的样本,则
(1) 样本均值 X 与样本方差S 2相互独立;
n
(2)
(n1)S2
2
(Xi X)2
i1
2
~2(n1)
(1)
与以下补充性质的结论比较:
性质 设(X1,X2,…,Xn)为取自正态总体
n
(Xi )2
X~N( , 2)的样本,则 i1 2
当X的分布关于y轴对称时, 若存在 x 2 , 使
P{Xx2},
则称 x
为X分布的双侧分位数或双侧临界值.
2
y
如图.
2
2
x 2 O x 2 x
标准正态分布的分位数
在实际问题中, 常取0.1、0.05、0.01.
常用到下面几个临界值:
u0.05 =1.645, u0.05/2=1.96,
u0.01 =2.326 u0.01/2=2.575
其几何意义见图所示.
其中f(y)是 2-分布的概率密度. O
2
(
n
)
x
显然,在自由度n取定以后,
2
(
n
) 的值只与有关.
例如,当n=21,=0.05时,由附表可查得
02.05(21) 32.67 即 P2 (2 1 ) 3 2 .6 7 0 .0 5 .
2分布的双侧分位数
的把数满足12P 2( n),2 22(1 2 n )2称(n 为) 2f分(P x布) 的2 双 侧 2 2 分(n 位) 数2