当前位置:
文档之家› 多元正态均值向量和协方差矩阵的检验
多元正态均值向量和协方差矩阵的检验
Var
(x)
cov(
x2 ,
x1
)
var( x2 )
cov(xp , x1) cov(xp , x2 )
cov(x1, xp ) cov( x2 , xp )
var( xp )
2020/5/23
5
由于样本均值
x
~
Np
(
,
1 n
)
,所以有
T02
(x
0
)
1 n
1
(x
0 )
n(x 0 )1(x 0 )
H0 : C H1 : C
其中C为一已知的kp阶矩阵,k<p, rank(C)=k , 为已知的k维向量。根据多元正态分布的性质可知
Cx ~ Nk (C,CC), rank(CC) k, CSC 0
2020/5/23
25
Cx
~
Nk
(C,C
Σ n
C),
(n 1)S ~ Wp (n, Σ)
第三章 多元正态均值向量和协方差
矩阵的检验
2020/5/23
1
内容
第一节 单个总体均值向量的推断 第二节 单个总体均值分量间结构关系的检验 第三节 两个总体均值的检验 第四节 两个总体均值分量间结构关系的检验 第五节 多个总体均值的比较检验(多元方差分析) 第六节 正态总体协方差矩阵的检验 第七节 在SAS多元假设检验过程
S2
1 n2 1
n2 i1
(yi
y)(yi
y)
34
霍特林(Hotelling)统计量T 2为:
1
T
2
n1n2 n1 n2
(x
y)
(n1
E n2
2)
(x y)
当原假设为真的条件下,统计量
n1 n2 p(n1
n2
p 1T 2)
2
~
F(
p,
n1
n2
p
1)
检验的规则为:
当
n1 n2 p(n1
12
注:似然比统计量
在数理统计中关于总体参数的假设检验, 通常还可以利用最大似然原理导出似然比统 计量进行检验。
设p维总体的密度函数为
f (x,θ)
其中 θ 是未知参数,θΘ参数空间。
2020/5/23
13
有如下假设:
H0 : θΘ0
H1 : θ Θ0
现在从总体中抽出容量为n的样本
x(1),x(2),...,x(n)
2
76
58.1
12.5
3
92
63.2
14.5
4
81
59.0
14.0
5
81
60.8
15.5
6
84
59.5
14.0
检验三个指标的均值是否有关系
1 6
1
1 4
2
3
2020/5/23
30
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2
,
3至少有两个不相等
T 2 n(Cx)CSC1 (Cx) ~ T (k,n 1)
CSC ~ Wk (n,CΣC)
nCx ~ Nk ( nC,CΣC),
T 2 nCx C CSC1 Cx C
2020/5/23
26
为了检验H0:C= ,可以用统计量
T 2 n(Cx )CSC1 (Cx )
当为真时 H0:C= 时
n k T 2 ~ F(k,n k) k(n 1)
对给定的显著性水平,检验的规则
p P{ 2 ( p) 所计算出的样本统计量 值 ,则拒绝原假设; p P{ 2 ( p) 所计算出的样本统计量 值 ,则接受原假设。
2020/5/23
7
2、总体协方差矩阵未知时 总体的协方差矩阵未知,用样本的协方差矩阵
S
1 (n 1)
n i1
(xi
x)(xi
x)
替代 T02 n(x 0 )1(x 0 ) 中的总体协方差,得
当
nk T k(n 1)
2
F
(k , n
k)
时,拒绝原假设;
当
nk T k(n 1)
2
F
(k , n
k)
时,接受原假设。
2020/5/23
27
特别当=0 ,即检验H0:C=0 , H1:C0,则
T 2 n(Cx)CSC1 (Cx)
S
1 (n 1)
n i1
(xi
x)(xi
x)
2020/5/23
28
2020/5/23
2
第一节 单个总体均值向量的推断 一、均值向量的检验
设 x1,x2, ,xn 是取自多元正态总体 N p (,) 的一个样 本, 0 ,现欲检验
H0 : μ μ0 H1 : μ μ0 由于总体的协方差矩阵可能未知或已知,所以在检验时 必须采用有不同的的统计量,所以我们分成两种情况来讨 论。
36
检验的统计量T 2 ndSd1d
其中 d x y
Sd
n
1
1
n
i1(di
d)(di
d)
当原假设 0为真时,统计量
n p T2 p(n 1)
服从自由度为n p和 p 的 F 分布。
检验规则为:
当时
n p T2 p(n 1)
F ( p, n
p)
,拒绝原假设,否则接受原
假设。
2020/5/23
在例中,假定人类的体形有这样一个一般规 律的身高、胸围和上臂围平均尺寸比例为6:4:1。 检验比例是否符合这一规律。检验:
H0
:
1 6
1
1 4
2
3
H1
:
1 6
1,
1 4
2
,
3至少有两个不等
2020/5/23
29
某地区农村男婴的体格测量数据如下
编号 1
身高(cm) 78
胸围(cm) 60.6
上半臂长(cm) 16.5
37
中小企业的破产模型 为了研究中小企业的破产模型,首先选定了X1总负债 率(现金收益/总负债),X2收益性指标(纯收入/总财 产),X3短期支付能力(流动资产/流动负债)和X4生产 效率性指标(流动资产/纯销售额)4个经济指标,对17个 破产企业为“1”和正常运行企业“2”进行了调查,得资 料如下。如果这些指标是用来做判别分析和聚类分析的变 量,他们之间没有显著性差异是不恰当的,所以检验所选 择的指标在不同类型企业之间是否有显著的差异。
x (x1, x2, , xn1 )和 y ( y1, y2 , , yn2 ) 且 0,n1, n2 p。
考虑假设 H0 : 1 2; H1 : 1 2
2020/5/23
32
根据两个样本可得1和2的无偏估计量为
x
1 n1
x n1
i1
i
y
1 n2
y n2
i 1
i
2020/5/23
33
X
n
p)
,接受原假设。
2020/5/23
9
【例】人的出汗多少与人体内的钠和钾的含量 有一定的关系,今测量了20位成年女性的出汗 量、钠含量和钾含量。试检验:
H 0 :μ μ0 4 50 10
2020/5/23
10
例 在企业市场结构研究中,起决定作用
的指标有市场份额X1,企业规模(资产净值 总额的自然对数)X2,资本收益率X3和总收 益增长率X4。为了研究美国市场的变动,夏 菲尔德抽取了美国231个大型企业,调查这些 企业某十年的资料。假设以前企业市场结构 的均值向量为(20,7.5,10,2)’,该调查所得的 样本均值向量和样本协方差矩阵如下。
样本的联合密度函数为
n
( L x(1), x(2),..., x(n);θ) f (x(i);θ) i1
2020/5/23
14
引入似然比统计量
max
θ0
max θ
(L x(1) , x(2) ,..., x(n);θ) (L x(1) , x(2) ,..., x(n);θ)
由于0 ,所以统计量取值在0到1之间。
n
(Xi X)(Xi X) n(X μ0 )(X μ0) i1
A n(X μ0)(X μ0)
2020/5/23
19
有
A0 A n(X μ0)(X μ0)
A
n(X μ0 )
n(X μ0) I
A 1 n(X μ0)A1(X μ0)
A0 A
1
n(X
μ0
17
原假设成立时,有
np
max Σ0
L(μ
0
,
Σ)
(2
)
2
A0 n
n/2 np
e2
n
其中 A0 (X - μ0 )(X - μ0 ) i1
A n 2 0
A
n 2
A0 A
n
2
2020/5/23
18
我们来讨论一下,似然比检验的 统计 量和霍特林的T平方统计量的关系。
n
A0 (Xi X X μ0 )(Xi X X μ0 ) i1
2020/5/23
22
1 1 0 0
令
C 1
0
1
0
1 0 0 1
则与上面的原假设等价的假设为
H0 : C 0
H1 : C 0
例 假定人类的体形有这样的一般规律:身高、胸围和
上臂围平均尺寸比例为6:4:1。检验身高、胸围和上臂 围平均尺寸比例是否符合这一规律。