当前位置:文档之家› 顺序统计量

顺序统计量


三、顺序统计量的分布
1、单个顺序统计量的分布
设总体X的密度函数为 f (x) ,分布函数为 F (x) , x1, x2, …, xn 为样本,则第 k 个次序统计量 x (k) 的 密度函数为:
证明: 对任意的实数 x ,考虑次序统计量 x(k) 取值 落在小区间 (x , x + x ] 内这一事件,它等价于 “样本容量为 n 的样本中有 1 个观测值落在区间 (x , x + x ] 之间,而有 k-1 个观测值小于等于 x , 有 n-k 个观测值大于 x + x ”,其直观示意图见下 图
充分统计量
•指统计量加工过程中无信息损失的统计量
100
•T1 X i
是不合格品率p的充分统计量
X0 1 2
p 1/3 1/3 1/3
现抽取容量为 3 的样本, 共有 27 种可能取值, 列表如下
x1 x2 x3 x(1) x(2) x(3) x1 x2 x3 x(1) x(2) x(3) x1 x2 x3 x(1) x(2) x(3) 0 00000110011220022 0 01001012012112112 0 10001021012121112 1 00001102012211112 0 02002201012122122 0 20002120012212122 2 00002210012221122 0 11011022022111111 1 01011202022222222
第2节 顺序统计量
一、定义
定义:设(X1,X2,…,Xn)是从总体X中抽取的一个样本
,(x1,x2,…,xn)是其中一个观测值,将观测值按 从小到大的次序重新排列为:
定义:X(k)取值为x(k)(k=1,2,…,n),由此得到
X (k) 称为第 k 个顺序统计量(即它的每次取值 总是取每次样本观测值由小到大排序后的第 k 个值).
k-1
1
n-k
x
x+x
x (k) 的取值示意图
F k(x x) F k(x)
n ! [F (x )]k 1 [F x x F (x )][1 F (x x )]n k
(k 1 )!(n k)!
两边同除以 x , 并令 x→0 , 即有
推论1 :最大次序统计量 x (n) 的概率密度函数为 推论2 :最小次序统计量 x (1) 的概率密度函数为
按概率密度函数计算次序统计量的密度函数:
设F(x)是总体X的分布函数,X1,X2,…,Xn为X 的样本,X(1),X(2),…,X(n)为顺序统计量, F(1)(x),F(n)(x)分别表示随机变量X(1),X(n)的 分布函数,则对任意实数x有:
按概率密度函数计算次序统计量的密度函数:
当X为连续型随机变量且有密度函数f(x)时,则 X(1),X(n)也是连续型随机变量,且它们的密度 函数分别为:
9/27
3/27
1
0
4/27
3/27
2
0
0
1/27
其分布 各不相同
X (1)与X (2)
并不独立
P( x(1)
0) P( x( 2)
0)
19 27
7 27
,而P( x(1)
0, x(2)
0)
7 27
注: 在一个样本中, X1 , X 2,……, Xn 是独立同分 布的, 而次序统计量 X (1) , X (2) ……, X (n) 则可 能既不独立, 分布也不相同.
例3:设(X1,X2,…,Xn)是来自正态总体N(12,9) 的样本,求:
解:1)因X1,X2,…,Xn独立,且服从相同分布
解: 我们首先应求出 x (2) 的分布。由总体密度函数 不难求出总体分布函数为
0 ,
F
(
x)
x3
,
1 ,
x 0; 0 x 1; x 1
可以得到 x (2) 的密度函数为
p 2 (x ) (2 1 ) 5 ! ( ! 5 2 )![F (x ) ] 2 1 p (x ) [ 1 F (x ) ] 5 2
2 0 x 3 3 x 2 ( 1 x 3 ) 3 6 0 x 5 ( 1 x 3 ) 3 , 0 x 1
于是
P (x(2)1 2)0 1 260x5(1x3)3dx
例1:设总体 X 分布为 U(0,θ), X1 , X2……, Xn 是 取自总体的样本,试写出 X(1) ,Biblioteka X(n) 的密度函数.p(1)
(
x)
n(1
x
)n-1
1
,
0 x ,
0,
others.
p(
n
)
(
x)
n( x
)n-1
1
,
0 x ,
0,
others.
例本2:。设求总:体f(1X)(~x)G,lf(n,)(xX)。1,X2,…,Xn为X的样
y x 31 8 2 0 y ( 1 y ) 3 d y 1 2 0 ( z 3 z 4 ) d z
0
7 8
5 ( 1 ( 7 ) 4 ) 4 ( 1 ( 7 ) 5 ) 0 . 1 2 0 7 88
四、思考
例5:设总体X的分布为仅取 0, 1, 2 的离散均匀分 布,
设总体 X 的分布如下:

计算公式
QL位置
n 4
QU位置
3n 4
五数概括与箱线图
次序统计量的应用之一就是五数概括与箱线图。在 得到有序样本后,容易计算如下五个值:
最小观测值 x min = x (1) ; 最大观测值 x max = x (n); 中位数 m 0.5 ; 第一 4 分位数 Q 1 = m 0.25 第三 4 分位数 Q3 = m 0.75 。 所谓五数概括就是指用这五个数来大致描述一批数 据的轮廓。
由此可得 X(1) , X (2) , X (3) 的分布列如下:
X(1) 0
12
p 19/27 7/27 1/27
X(2) 0
12
p 7/27 13/27 7/27
X(3) 0
12
p 1/27 7/27 19/27
进而可得 X(1)与 X (2) 的联合分布如下:
X(1)
X(2) 0
1
2
0
7/27
特别的
说明
二、常用顺序统计量
• 极差 • 中位数 • 分位数 • 四分位数
1、极差 极差反映了随机变量X取值的分散程度。
2、中位数
① 排序后处于中间位置上的值
50%
50%
Me
3、分位数
4、四分位数:
① 排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
② 不受极端值的影响
相关主题