当前位置:
文档之家› 次序统计量与百分位点的区间估计
次序统计量与百分位点的区间估计
29
(10,20)
(10,19)
(11,20)
0.90685 0.947521 0.924649 0.90686 0.936085 0.936085 0.90686 0.912877 0.936085 0.912877 0.924481 0924481 0.947761 0.901202 0.924481 0.9447761 0.901202 0.947761 0.912841 0.912841 0.938572 0.912841 0.938572 0.938572 0.901263 0.901263
表 3.3
( ) π 0.75 的次序统计量区间估计表___置信度∈ 0.90,0.95
-4-
n
(i, j)
p(Yi < π 0.75 < Y j )
n
(i, j)
p(Yi < π 0.75 < Y j )
10
(5,10)
0.923959
(15,23)
(9,15)
0.930016
26
(17,26)
0.90858
(8,14)
0.902519
(17,25)
0.903688
16
(10,16)
0.91042
(9,11)
23
(1,9)
(2,10)
(3,10)
0.923959 0.923437 0.913921
0.943911 0.930016 0.902519 0.915626 0.91042 0.909394 0.929054 0.90965 0.937502 0.937414 0.903588 0.941188 0.918315 0.940245 0.934762 0.904297 0.941475 0.924826 0.904847 0.919054 0.923628 0.910546 0.909842 0.929376 0.902339 0.947626 0.910018
0.942569 0.929244 0.901263 0.942569 0.929244
( ) 表 3.2 π 0.25 的次序统计量区间估计表___置信度∈ 0.90,0.95
n
(i, j)
p(Yi < π 0.25 < Y j )
n
(i, j)
p(Yi < π 0.25 < Y j )
10
(1,6)
1 n +1
.
可见,次序统计量 Y1 ≤ Y2 ≤ L ≤ Yn 把总体的概率密度曲线与横轴所围的面积分为
n + 1份,且每一份面积的期望值均相等。这个性质可在非参数统计中得到应用[2]。
3. 百分位点的估计
3.1 百分位点的概念及其点估计
定 义 2 设 ξ 是 连 续 型 随 机 变 量 , 其 概 率 密 度 是 f (x) , 若 有 实 数 π p 使 得
n
(i, j)
p(Yi < π 0.5 < Y j )
10
(2,8)
(3,9)
11
(3,9)
12
(2,9)
(3,9)
(4,10)
(4,11)
13
(3,10)
(4,11)
(4,10)
14
(3,10)
(4,11)
(5,12)
15
(4,11)
(5,12)
16
(5,12)
17
(5,12)
(6,13)
18
(4,13)
2. 次序统计量
设 ξ1,ξ2 ,L,ξn 是取自母体ξ 的一个子样。 x1, x2 ,L, xn 表示该子样的一组观测值。这
些观测值由小到大的排列用 x(1) , x(2) ,L, x(n) 表示,即 x(1) ≤ x(2) ≤ L ≤ x(n) .若其中有两个分
量 xi , x j 相等,则它们先后次序的安排是可以任意的。
=
(n + 1) p 为正整数,
则
r 可由此关系式确定。若 (n + 1) p 为非正整数,则可取 r =[(n+1)p],这是 (n +1)p的取整值,
π p 的估计可由 Yr 与 Yr+1 的加权平均值确定,即πˆp =Yr +{(n+1)p−r}(Yr+1 −Yr) [3] .
特别当 p = 0.5 时,
0.936305
(4,10)
0.940181
(14,22)
0.938861
11
(6,11)
0.923423
(15,22)
0.905534
12
(7,12)
0.913921
25
(16,25)
0.927919
13
(16,24)
0.921646
14
(8,14)
0.943911
(15,23)
0.93822
15
11
(1,6)
12
(1,6)
13
14
(1,7)
15
(1,7)
(2,8)
(2,9)
16
(1,7)
(2,8)
(2,9)
17
(2,8)
(2,9)
18
(1,8)
(2,8)
(2,9)
19
(1,8)
(2,9)
20
(2,9)
(3,11)
21
(1,9)
(2,9)
(3,10)
(3,11)
22
(1,9)
(2,9)
(3,10)
若令 Yr = ξ(r ) , Z r = F (Yr ) 且 Y1 ≤ Y2 ≤ L ≤ Yn , 则
E(Zr )
=
r ,r n +1
= 1,2,Ln .
推论
E[F (Yr
] − Yr−1 ) =
1 ,r n +1
=
2,L, n
.
特别
E[F (Y1)] =
1, n +1
E[1 −
F (Yn )] =
(7,15)
(7,16)
(8,17)
(8,16)
23
(7,16)
(8,17)
(8,16)
24
(7,16)
(8,17)
(9,18)
25
(8,17)
(9,18)
26
(8,18)
(8,17)
(9,18)
(9,19)
(10,19)
29)
28
(9,19)
(10,19)
(10,20)
(4,12)
(4,13)
(4,14)
30
(1,12)
(2,12)
(3,12)
(4,12)
(4,13)
0.935939 0.944332 0.936305 0.905534 0.938861 0.927919 0.921648 0.938222 0.90858 0.903688 0.934078 0.904344 0.946799 0.94299 0.926481 0.911778 0.931786 0.928823 0.915489 0.915453 0.911924 0.947686 0.901183 0.915462 0.938714 0.948849 0.949163 0.947377 0.938746 0.911892 0.940957
次序统计量与百分位点的区间估计
赵琳琳
河海大学数理系 江苏南京 (210098) E-mail :Zhao555818@
摘要:本文给出了未知连续型总体百分位点的一种次序统计量的区间估计方法。首先介绍
次序统计量的定义及其概率密度函数和分布函数,然后介绍连续型随机变量的分布函数作为 随机变量的性质,来求得其分布函数变量取次序统计量时的期望值。发现次序统计量把总体 的概率密度曲线与横轴所围的面积分为 n+1 份,每份面积的期望值均相等。正是由于次序统 计量的这种性质,我们得出结论:可以用次序统计量来推求总体百分位点的区间估计。本文 在样本容量 10-30 的范围内,由次序统计量分别求出了 0.25、0.50、0.75 百分位点置信度 为 0.90-0.95 的置信区间,可供实际查用。另外,我们发现:当 n 充分大时,对于给定的置 信区间,利用次序统计量通过二项分布求出的置信度与通过正态分布求得的近似置信度偏差 很小。于是又得结论:当 n>20 时我们可以用正态分布来求得总体百分位点的近似置信区间。 关键词:次序统计量,百分位点,区间估计 中图分类号:查阅《中国图书馆分类法》
-3-
(7,16)
(7,15)
21
(6,15)
(7,16)
(7,15)
22
(6,15)
0.936432 0.921646 0.947521 0.947521 0.921646 0.924649
30
(9,20)
(10,20)
(11,20)
(11,22)
(11,21)
-2-
∑ p(Yi
<πP
< Yj) =
j k
−1 =i
⎜⎜⎝⎛
n k
⎟⎟⎠⎞
p
k
(1
−
p)n−k
= 1 − α , (1 ≤ i <
j ≤ n)
即得π p 的置信度为1 − α 的置信区间 (Yi ,Y j ) 。由观测值 x1, x2 ,L, xn 即可求得置信区间的
值 ( y i , y j ) ,其中 yi = x(i) 。为了计算方便起见,可先确定 r = (n + 1) p ,若 r = (n + 1) p 为 正整数,取下标对称的区间 (Yr−i ,Yr+i ) ,试算 i =1,L,min(n − r,r −1) 最后确定满足要求的区 间。若 r = (n + 1) p 为非正整数,r 分别取[(n + 1) p], [(n + 1) p] + 1即可。下面只对 n 从