当前位置:文档之家› 第六章(4)多元正态总体均值向量的假设检验

第六章(4)多元正态总体均值向量的假设检验

第六章(4)多元正态总体均值向量的假设检验类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。

我们只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例第1节 HotellingT 2分布为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。

定义 设),(~),,(~∑∑n W S N Xp p μ且X 与S 相互独立,pn ≥,则称统计量XS X n T12-'=的分布为非中心HotellingT 2分布,记为),,(~22μn p T T 。

当0=μ时,称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录 先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。

在一元统计中,若n X X ,,1 来自总体),(2σμN 的样本,则统计量:)1(~ˆ)(--=n t X n t σμ分布其中212)(11ˆ∑=--=ni iX Xn σ显然)()ˆ()(ˆ)(12222μσμσμ-'-=-=-X X n X n t与上边给出的T2统计量形式类似,且⎪⎪⎭⎫⎝⎛-n N X 2,0~σμ。

可见,T 2分布是一元统计中t 分布的推广。

基本性质:在一元统计中,若统计量)1(~-n t t 分布,则)1,1(~2-n F t 分布,即把t 分布的统计量转化为F 统计量来处理,在多元统计分析中T 2统计量也具有类似的性质。

定理 若),(~),,0(~∑∑n W S N Xp p 且X 与S 相互独立,令X S X n T 12-'=,则)1,(~12+-+-p n p F Tnpp n这个性质在后面经常用到。

第2节 均值向量的检验设p 元正态总体),(∑μp N ,从总体中抽取容量为n 的样本∑∑=='--==ni ni i i i n X X X XS X nX X X X 11)()()()()2()1())((,1,,,, 。

一、∑已知时均值向量的检验01000:H )(:μμμμμ≠=为已知向量H检验统计量:)(~)()(201020p X X n T χμμ-∑'-=-(在H 0成立时)给出检验水平α,查2χ分布表使{}αλα=>20T P ,可确定出临界值αλ,再用样本值计算出20T ,若αλ>20T ,则否定H 0,否则H 0接受。

这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。

二是说明它为什么服从)(2p χ分布。

一元统计中,当2σ已知时,作均值检验所取的统计量为:)1,0(~0N nX U σμ-=显然,)())(()(01202202μσμσμ--=-=-X X n X n U与上边给出的检验统计量20T 形式相同。

另外根据二次型分布定理: 若),0(~∑p N X,则)(~21p X X χ-∑'。

显然,1001020)()()(--∑'-=-∑'-=μμμX n X X n T )(0μ-X n YY 1-∑'∆。

其中,),0(~)(0∑-=p N X n Y μ,因此,)(~)()(201020p X X n T χμμ-∑'-=-。

二、∑未知时均值向量的检验00:μμ=H01:μμ≠H检验统计量:),(~)1(1)1(2p n p F Tpn p n --+--(在H 0成立时)其中[])()()1(01'02μμ---=-X n S X n n T 。

给定检验水平α,查F 分布表,使αα=⎭⎬⎫⎩⎨⎧>--F Tpn p n p 2)1(,可确定出临界值αF ,再用样本值计算出2T ,若αF Tpn p n >--2)1(,则否定0H ,否则0H 相容。

这里需要解释的是,当∑未知时,自然想到要用样本协差阵Sn 11-去代替∑,因(1-n )S -1是1-∑的无偏估计量,而样本离差阵),1(~)()()(1)(∑-'--=∑=n W X X X XS p a nx a),0(~)(0∑-p N X n μ[]),(~)()()1(T 20102p n p T X n SX n n --'--=∴-μμ再根据Hotelling T 2分布性质,所以),(~)1(1)1(2p n p F Tpn p n --+--例1. 人的出汗多少与人体内钠和钾的含量有一定的关系。

今测20名健康成年女性的出汗多少(X 1)、钠的含量(X 2)和钾的含量(X 3),其数据如下表。

试检验0100:,)10,50,4(:μμμμ≠'==H H 。

经计算)965.9,4.45,64.4('=X )035.0,6.4,64.0(0'-=-μX⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=9255.6816.107374.3216.10798.379559.177374.3259.177764.55S为了计算)()(010μμ-'--X SX ,令)(),(001μμ-=-=-X SY X S Y 则,于是得如下方程组,⎪⎩⎪⎨⎧=+---=-+=-+035.09255.6816.107374.326.416.10798.379559.17764.0374.3259.177764.55321321321y y y y y y y y y解得:0020.0,0015.0,0151.0321-=-==y y y 。

于是YX X SX )()()(0010'-=-'--μμμ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---=0020.00015.00151.0)035.0,6.4,64.0(=0.016494)())(1(0102μμ-'--=-X SX n n T26772.6016494.01920=⨯⨯=87.126772.631917=⨯⨯=F查F 表得18.5)01.0(,2.3)05.0(17,317,3==F F 。

因此在a = 0.05或0.01时接受H 0假设。

三、协差阵相等时,两个正态总体均值向量的检验设 ,n ,a N X X X X p ap a a a 1 ),(~),,,(121)(=∑'=μ,m ,a N Y Y Y Y p ap a a a 1 ),(~),,,(221)(=∑'=μ且两组样本相互独立,∑∑====mi i ni i Y mY XnX1)(1)(1,1。

(1)有共同已知协差阵时210:μμ=H211:μμ≠H检验统计量:)(~)()(2_120p Y X Y X mn m n Tχ---∑'-+⋅=(在H 0成立时)给出检验水平a ,查)(2p x 分布表使{}aT P a =>λ2,可确定出临界值a λ,再用样本值计算出20T ,若aT λ>20,则否定H 0,否则H 0相容。

在一元统计中作均值相等检验所给出的统计量:)1,0(~22N mnYX U σσ+-=显然,222222)()()(Y X m n m n mnY X U-+⋅=+-=σσσ)1(~)()()(212,χσY X Y X mn m n --+⋅=-此式恰为上边统计量当1=p 时的情况,不难看出这里给出的检验统计量是一元情况的推广。

(2)有共同的未知协差阵0>∑时210:μμ=H211:μμ≠H检验统计量:)1,(~)2(1)2(2--+-++--+=p m n p F Tpm n p m n F (在H 0成立时)其中:⎥⎦⎤⎢⎣⎡-+⋅⎥⎦⎤⎢⎣⎡-+⋅-+=-)()()2(1'2Y X m n mn S Y X m n mn m n T21S S S +='211)()(1),,,(X ,))((p na a a X X X X X X XS ='--=∑='21'1)()(2),,,(Y ,))((Y Y Y Y Y Y YS ma a a =--=∑=给定检验水平α,查F 分布表使{}αα=>F F P ,可确定出a F ,再用样本值计算出F ,若αF F >,则否定H 0,否则H 0相容。

当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵111S n -和211S m -去代替,而),1(~)()()(1)(1∑-'--=∑=n W X X X XS p na a α),1(~)()()(1)(2∑-'--=∑=m W Y Y Y YS p ma a α从而),2(~21∑-++=m n W S S S p ,所以)1,(~)2(1)2(2--+-++--+p m n p F Tm n p m n下述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给出统计量及其分布,为节省篇幅,不做重复的解释。

四、协差阵不等时,两个正态总体均值向量的检验设n,1, ),(~),,,(1121)( =∑'=αμp apa a a N XXXXm,1, ),(~),,,(2221)( =∑'=αμp ap a a a N Y Y Y Y且两组样本相互独立,0,021>∑>∑210:μμ=H211:μμ≠H分两种情况 (1)n = m 令n,1,i )()()( =-=i i i Y X ZYX Z nZ ni i -==∑=1)(1∑=--=nj j j Z Z Z ZS 1')()())((∑=+--+--=nj i j i j Y X Y X Y X Y X1')()()()())((检验统计量:),(~)(1'p n p F Z SZ pnp n F --=- (在H 0成立时)(2),m n ≠不妨假设m n < 令∑∑==-⋅+-=nj mj j j i i i Y mYmn Y mn X Z 11)()()()()(11ni ,,1 =YX ZnZ ni i -==∑=1)(1∑='--=ni i i Z Z Z ZS 1)()())((∑∑==⎥⎥⎦⎤⎢⎢⎣⎡---=ni nj j i i Y n Y mn X X 11)()()()1()('⎥⎥⎦⎤⎢⎢⎣⎡---⋅∑=)1()(1)()()(nj j i i Y n Y mn X X检验统计量:),(~)(1'p n p F Z SZ pnp n F --=-例2 。

相关主题