当前位置:
文档之家› 多元统计分析:第三章 多元正态总体参数的假设检验(补充)
多元统计分析:第三章 多元正态总体参数的假设检验(补充)
18
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X
(t ) (i )
X )(t 1,2)
21
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
(2)当
(1)
2
( 2) nt
时, 取
1 1 (t ) ˆ T时, ˆ X X (i ) , n t 1 i 1 n 似然函数达最大值:
设X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是来自p元总体X的 样本, 检验 H0: X~Np(μ,Σ),H1:X不服从Np (μ,Σ).
1. χ2统计量的Q-Q图检验法(或P-P图检验法)
这是由正态分布的性质④构造的检验法. 在 H0下,样品X到总体中心 μ的广义平方距离 (或称马 氏距离)D2(X,μ)记为D2 ,则有 D2 =(X-μ)′Σ-1(X-μ)~χ2(p) 以 下 构 造 的 检 验 方 法 就 是 检 验 统 计 量 D2 是 否 ~ χ2(p). 直观的想法是:由样品 X(α) 计算 D2α(α=1,…,n), 对D2α排序:
第三章 多元正态总体参数的假设检验
§3.6正态性检验--二维数据的正态性检验
2. 二维数据的χ2 因二维数据的χ2图检验法与p维数据的χ2图 检验法原理完全相同.故关于二维数据的χ2 图检 验方法请参阅下面p维数据的χ2图检验方法.
8
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
第三章 多元正态总体参数的假设检验
§3.6正态性检验--一维边缘分布的正态性检验
在实际应用中如果经过从多方面得到的检验结果与 正态分布均无显著性差异,也就认为该总体X与p元正 态无显著差异. 设 p 维 随 机 向 量 X=(X1,…,Xp)′, 检 验 分 量 Xi~ N(μi,σ2) (i=1,…,p) ,把p维正态性检验化为 p个一 维数据的正态性检验.常用的检验方法有以下几种. 1. χ2检验法 这是适用于连续型或离散型随机变量分布的拟合优 度检验方法,也称为Pearson χ2 检验法. 2. 柯氏(Kolmogorov,A.N.)检验法 这是适用于连续型分布的拟合优度检验方法.
所涉及的最大似然估计量—两个总体
两个p维正态总体Np(μ(1),Σ)和Np(μ(2),Σ),设 X(t)(i)( t=1,2; i=1,…,nt)为来自p维总体的随机样 本.样本的似然函数为(n=n1 + n2 )
L( , ) 2 nt 2 1 1 (t ) (t ) (t ) (t ) etr ( X )( X ) ( i ) ( i ) 2 t 1 i 1
np 1 1 L( X , T ) 2 2 T n n n np 2 2
e
22
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
其中总离差阵 T A B(称B为组间离差阵 ), B nt ( X
应用多元统计 分析
第三章 多元正态总体
参数的假设检验(二)
1
第三章 多元正态总体参数的假设检验
目
录 (二)
§3.6 正态性检验
第三章所涉及的最大似然估计量小结
2
第三章 多元正态总体参数的假设检验
§3.6 正态性检验
在均值和协差阵的检验中 ,以及以后将介绍的一些 统计方法中都是假定样本来自 p 元正态总体 . 所作统计 推断的结论是否正确 ,在某种意义上取决于实际总体与 正态总体接近的程度如何?因此建立一些方法来检验多 元观测数据与多元正态数据的差异是否显著是十分必 要的. 设X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是来自p元总体X的样 本,试问总体X是否服从Np(μ,Σ)分布? 若总体 X=(X1,…,Xp)′~Np(μ,Σ), 利用多元正态分布的 一些性质可知(记μ=(μ1,…,μp)′,Σ=(σij)p×p ):
14
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
p维观测数据提供的信息大部分可由前几个 新变量所提供.这时p维数据的正态性检验可化 为几个相互独立的新变量的一元数据的正态性 检验 . 这些新变量在第七章主成分分析中被称 为主成分.故此检验法称为主成分检验法. 如果正态性假设不能成立,一般应考虑对 数据进行变换,使非正态数据更接近正态,然 后对变换后的数据进行统计分析 . 有关变换的 方法请见参考文献[5]、[6]或[7].
12
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
(5) 以平方距离为横坐标,χ2 分位数为纵坐标作为 平面坐标系,用n个点(D2(t) ,χt2 )绘制散点图,即得 到卡方分布的Q-Q图;或者用另n个点(pt , H(D2(t) | p)) 绘制散点图,即得卡方分布的P-P图. (6) 考察这n个点是否散布在一条通过原点,斜率为 1的直线上 .若是 ,接受数据来自 p 维正态总体的假设 ; 否则拒绝正态性假设.
13
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
2. 主分量检验法
设 X(i)=(Xi1, Xi2,…, Xip)′(i=1,…,n) 为 来 自 p 维 总 体 X=(X1,…,Xp)′的观测数据(样本).检验 H0: X~Np(μ,Σ),H1:X不服从Np(μ,Σ). 设 样本协差阵 S 的特征值为 λ1≥λ2≥…≥λp>0,相应的特 征向量为l1,l2,…,lp.记lt=(l1t , l2t ,… , lpt)′.令 Zt= l1t X1+ l2t X2+…+ lptXp (t=1,2,…,p) 即新变量Z1,…,Zp 是X1,…,Xp的线性组合.且可以证明: Z1,…,Zp 是相互独立的.
n i 1 n
np 2
A0 n
2
np exp - 2
其中A0 ( X (i ) 0 )( X ( i ) 0 ) A ( X ( i ) X )( X (i ) X )
i 1
17
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
这种检验法其实就是卡方分布的Q-Q图检验法. 类似地也可以绘制点(pt , H(D2(t) |p))的散布图,当 X为正态总体时,这些点也应散布在一条直线上.这种 检验法其实就是卡方分布的P-P图检验法. 具体检验步骤如下: (1) 由n个p维样本点X(α) (α=1,…,n)计算样本均值X, 样本协差阵S:
5
第三章 多元正态总体参数的假设检验
§3.6正态性检验--一维边缘分布的正态性检验
3. 偏峰检验法 4. W (Wilks)检验和D 5. Q-Q (Quantile Quantile)图检验法 6. P-P (Probability Probability )图检验法 7. “3σ”原则检验法 8. A2和W2统计量检验法 方法3至方法8都是只适用于正态分布的检验 法.
20
np 2
n 2
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—两个总体
其中A A1 A2 (称A为组内离差阵 ), At ( X
i 1 nt (t ) (i )
1 L( X , X , A) 2 n
(1) ( 2)
(t )
1 ˆ ˆ X , ˆ X , ( A1 A2 )时 (1)当 n n 似然函数达最大值:
(3) 当 0 (0 0巳知, 未知)时,
2 2
1 1 ˆ X , ˆ 取 tr(0 A)时 np 似然函数达最大值:
2
ˆ 0 ) 2 L( X ,
2
np 2
tr( 0 A) np
1
np 2
0
-
n 2
np exp - 2
3
第三章 多元正态总体参数的假设检验