多元正态分布参数的假设检验
2. 算样本的均值 X
( ) ( ) 3. 计算统计量T的具体值 T02 = n X − μ0 ′ Σ−1 X − μ0 .
4. 按规定的小概率标准α,查 χ 2分布表,得临界
值 χα2 ( p),并作出判断: 当 T02 ≤ χα2 ( p),接受H0,拒绝H1,即认为与没有显
著差异。 当 T02 > χα2 ( p),接受H1,拒绝H0,即认为与有显著
当p = 1时,因为,X
~
N1 ( μ1 ,
σ2
n
)
,Y
~
N1 ( μ2
,
σ2
m
)
,
且相
互独立,在,H0成立条件下,有
(X −Y) 1 + 1
t=
nm
~ t(n + m− 2)
∑ ∑ ⎡ n
⎢
(Xi
− X)2
+
m
(Yi
−Y
)2
⎤ ⎥
(n+m−2)
⎣ i=1
j=1
⎦
∑ ∑ 显然
t2 = nm
⎡ ⎢
n
Xj −X
Xj −X ′
9
武汉理工大学统计学系唐湘晋
( )( ) ∑ 在
H 0 :μ
=
μ0下, S=
X~
n
X
1 NP (μ0 , n Σ)
j -X Xj -X
′
,
~
X − μ0 ~
Wp (n −1,
NP (0,
Σ).
1 n
Σ)
j =1
故由T2分布定义知
( ) ( ) T 2 = (n −1) ⎡⎣ n X − μ0 ⎤⎦′ S−1 ⎡⎣ n X − μ0 ⎤⎦ ~ T 2 ( p, n −1)
6
武汉理工大学统计学系唐湘晋
在原假设 H0 下,
X
~
Np
⎛ ⎜⎝
μ0
,
1 n
Σ ⎞⎟⎠.
则
( ) X = μ0 +
1 n
1
Σ2Y
,Y
~
Np
0, I p
.
( ) −1
n Σ 2 X − μ0 = Y
( ) ( ) T02 = n X − μ0 ′ Σ−1 X − μ0 = Y'Y ~ χ 2 ( p)
且相互独立,由Wishart分布的可知性知
S1 + S2 ~ Wp (n + m − 2, Σ)
18
武汉理工大学统计学系唐湘晋
由T2统计量的定义知
T2
=
(n
+m−2) Nhomakorabeanm n+m
(X
−
Y)′(S1
+
S2 )−1(X −
Y)
~
T2(
p, n
+
m
−
2)
利用T2与F的关系,检验统计量取为
F
=
(n
+
m − 2)
设 X1, X2 ,K, Xn为来自总体 X ~ N p ( μ1 , Σ) 的样本;
Y1, Y2 ,K, Ym 为来自总体 Y ~ N p ( μ2 , Σ) 的样本,且
两总体相互相互独立,Σ未知。要检验两总体均值是 否相等,即
H0 : μ1 = μ2 H1 : μ1 ≠ μ2
15
武汉理工大学统计学系唐湘晋
~ F(p,n− p) 计算F统计量具体值F。
−
X)′
4. 按规定的显著水平α,查F分布临界值 Fα ( p, n − p) ,
并作出判断:
当 F0 ≤ Fα ( p, n − p),接受H0,拒绝H1,即认为与没有 显著差异。
当F0 > Fα ( p, n − p),接受H1,拒绝H0,即认为与有显 著差异。
Xi − X
Xi − X ′ + m Yj − Y
j =1
Yj
−Y
′⎤ ⎥
⎦
∑ ∑ 其中
X
=
1 n
n i =1
Xi ,
Y=
1 m
m
Yj
j =1
在原假设H0下
( ) T 2 = nm n+m
X − Y ′ Ve-1(X − Y) ~ T 2 (p, n + m -1)
n + m − p −1
(n + m − 2) p
T2
~
F(p, n
+
m
−
p
−1)
17
武汉理工大学统计学系唐湘晋
因为在H0成立条件下
(X
-
Y)
~
N
p
(0,
(
1 n
+
1 m
)Σ),
nm n+m
(X
-
Y)
~
Np
(0,
Σ)
n
∑ S1 = (Xi - X)(Xi - X)′ ~ Wp (n −1, Σ) i =1 m
∑ S2 = (Yj − Y)(Yj − Y)′ ~ Wp (m −1, Σ) j =1
11
武汉理工大学统计学系唐湘晋
例 某小麦良种的四个主要经济性状的理论值 为 μ0 = (22.75, 32.75, 51.50, 61.50)′ 。现在从外地引入 一新品种,在21个小区种值,取得如表所示数据。设 新品种的四个性状 X = ( X1, X 2 , X 3, X 4 )′ ~ N4 (μ, Σ), 试检 验假设 H0 : μ = μ0 (α = 0.05)
4
武汉理工大学统计学系唐湘晋
§3.2 多元正态分布的均值向量的检验
p维正态总体 N p (μ, Σ) 的统计推断问题,包括均 值向量的检验和均值的置信域问题。 p维正态随 机向量的每一个分量都是一元正态变量,若将p 维均值向量的检验问题化为p个一元正态的均值 检验问题,虽然可以使问题简化,但忽略了p个 分量间的互相依赖关系,常常得不出正确的结 论。
3.015 0.607
⎤ ⎥ ⎥ ⎥ 1.111⎥⎦
⎡26.643
S2
=
⎢ ⎢
8.288
⎢18.290
⎢ ⎣
5.578
9.902 8.127 4.049
22.082 7.310
⎤ ⎥ ⎥ ⎥ 3.911⎥⎦
2.由原始数据计算得
⎡50.06⎤
X
=
⎢⎢34.28⎥⎥ ⎢14.62 ⎥
⎢ ⎣
2.46
⎥ ⎦
⎡59.36⎤
Y = ⎢⎢27.66⎥⎥ ⎢42.60⎥
⎢⎣13.26
⎥ ⎦
21
武汉理工大学统计学系唐湘晋
⎡12.425
S1
=
⎢ ⎢ ⎢
9.922 1.636
⎢ ⎣
1.033
14.369 1.170 0.930
−
p
+1 T
2
~
F( p,n
+
m−
p
− 1)
(n + m − 2) ⋅ p
19
武汉理工大学统计学系唐湘晋
具体步骤是:
1.作统计假设:H0:μ1 = μ2 , H1:μ1 ≠ μ2
2.计算样本的均值 X 和 Y ,样本离差阵S1和S2
3.由公式F
=
(n + m − 2) − p +1T 2 (n + m − 2) ⋅ p
23.16 32.78 51.48 61.41
7
22.67 32.58 51.44 61.30
14
22.67 32.67 51.43 61.15
21
23.13 32.95 31.38 61.58
13
武汉理工大学统计学系唐湘晋
解:
X
=
⎡ ⎢ ⎢ ⎢ ⎢ ⎢⎣
X1 X2 X3 X4
⎤ ⎥ ⎥ ⎥ ⎥ ⎥⎦
=
⎡22.82⎤ ⎢⎢32.79⎥⎥ ⎢51.45⎥ ⎢⎣61.38⎥⎦
∑ V
=
1 21 − 1
21 i =1
(Xi
−
X)(Xi
−
X)′
⎡ 70.3076
=
⎢⎢−52.1469 ⎢ 3.4462
⎢ ⎣
−6.9624
73.5511 −19.3637
1.2022
90.4098 −33.6989
⎤ ⎥ ⎥ ⎥ 40.0895⎥⎦
第三章
多元正态分布参数的假设检验
1
武汉理工大学统计学系唐湘晋
§3.1 基本概念
统计假设检验包括两类问题:一是已经知道随机变量 分布函数的形式,但其中包含几个未知的参数,要求 检验这些参数是否等于某些已知的数值,这类问题称 为参数的假设检验;二是随机变量的分布函数未知, 要检验它是否服从某一已知的分布,这类问题称为分 布的假设检验。
3
武汉理工大学统计学系唐湘晋
小概率原理
一个概率很小的事件,在一次试验中可以认为是不可 能发生的; 在假设检验中,接受或拒绝原假设的决定是根据样本 特征值与假设值的偏差超过一定界限的概率作出的, 如果这个概率很小,就拒绝假设;如果这个概率较 大,就接受假设。这里显然有一个标准问题,即要规 定一个很小的概率α作为临界值,当上述偏差超出规 定界限的概率小于或等于α时,就拒绝原假设,反之 就接受原假设。这个临界概率α称为显著性水平。
差异。
8
武汉理工大学统计学系唐湘晋
二、Σ未知时单个总体均值向量的检验
建议:用样本协方差S来替换Σ ,即
( ) ( ) T 2 = n X − μ0 ′ V-1 X − μ0 = n (n −1)(X − μ0 )′ S-1 (X − μ0 )