第3章 多元正态总体的假设检验与方差分析从本章开始,我们开始转入多元统计方法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。
统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。
参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。
3.1一元正态总体情形的回顾一、 假设检验在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2σμN 的样本,我们要检验假设100:,:μμμμ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。
备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,用统计量nX z σμ-=在原假设0H 成立下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
对于检验问题(3.1.1),我们制定这样一个检验规则(简称检验): 当2αz z >时,拒绝0H ;当2αz z ≤时,接受0H 。
(3.2) 我们称2αz 为临界值,是)1,0(N 的上分位点,不同的临界值代表不同的检验。
称拒绝原假设0H 的统计量z 的范围为拒绝域,称接受0H 的统计量z 的范围为接受域,因此给出一个检验,就是给出一个拒绝域。
2、两类错误由于样本具有随机性,因此在根据样本进行判断时,有可能犯两种类型的错误。
一类错误是,原假设0H 本来正确,但按检验规则却作出了拒绝0H 的判断,这类错误称为第一类错误(弃真错误),其发生的概率{}αα=>2z z P 称为犯第一类错误的概率;另一类错误时,原假设0H 本来不正确,但按检验规则却作出了接收0H 的判断,这类错误称为第二类错误(存伪错误),其发生的概率称为犯第二类错误的概率,记为β。
同时控制这两类错误是困难的,当时在样本容量n 固定的条件下,要使α和β同时减小,通常是不可能的。
在假设检验的应用中,由奈曼(NEYMAN)与皮尔逊(PEARSON)提出了一个原则,即在控制犯第一类错误的概率α条件下,尽量使犯第二类错误的概率β小,这种检验问题, 称为显著性检验问题。
根据这一原则,原假设受到保护,不至于被轻易拒绝,一旦检验结果拒绝了原假设,则表明拒绝的理由是充分的,如果接受了原假设,则只是表明拒绝的理由还不充分,未必意味着原假设就是正确的。
所以,在实际问题中,为了通过样本观测值对某一猜测取得强有力的支持,通称我们把这一猜测的否定作为原假设,而把猜测本身作为备择假设。
3、关于检验的p 值下面,我们再介绍进行检验的另一种方式——p 值,我们就以(3.1.1)的检验问题为例来加以说明,对于样本,我们通过统计量,计算出nx z σμ00-=,是一确定值,这里的x 是样本观测值的均值,再由统计量z 服从正态分布z )1,0(~N ,计算}{0z z P >为检验的p 值。
由于αz z >等价于p =}{0z z P >{}αα=>≤2z z P ,所以检验规则可以表述为: 当α≤p 时,拒绝0H ;当α>p 时,接受0H 。
接受0H 。
(3.3) 上述p 值的检验规则与(3.1.2)的检验结果相比含有更丰富的信息,p 值越小,拒绝原假设的理由就充分。
通常SAS 等软件的计算机输出一般只给出p 值,由你自己给定的α值来判断检验结果二、单一变量假设检验的回顾 1、 单个正态总体均值的检验考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2σμN 的样本,我们要检验假设100:,:μμμμ≠=H H(1) 总体方差2σ已知构造统计量nX z σμ-=在原假设H 成立下, z 服从正态分布z )1,0(~N ,可得这样一个检验规则: 当2αz z >时,拒绝0H ; 当2αz z ≤时,接受H 。
(2) 总体方差2σ未知构造统计量nsX t μ-=在原假设0H 成立下,t 服从自由度为1-n 的t 分布t )1(~-n t 可得这样一个检验规则:当)1(2->n t t α时,拒绝0H ;当)1(2-≤n t t α时,接受H 。
(3.1.4)2、 两个正态总体均值的比较检验 考虑假设检验问题 211210:,:μμμμ≠=H H (3.1.5)设121,,,n X X X 是取自总体),(211σμN 的容量为1n 的样本,221,,,n Y Y Y 是取自),(222σμN 的容量为2n 的样本,给定显著性水平α。
(1) 两个总体方差21σ和22σ已知 构造检验统计量222121n n YX z σσ+-=(3.1.6)在原假设H 成立下, z 服从正态分布z )1,0(~N ,检验规则为:当2αz z >时,拒绝0H ; 当2αz z ≤时,接受H 。
(2) 两个总体方差21σ和22σ都未知,但21σ=22σ=2σ 用样本方差s 代替σ,构造检验统计量2111n n s YX t +-=在原假设H 成立下,t 服从正态分布t )2(~21-+n n t ,检验规则为:当)2(212-+>n n t t α时,拒绝0H ;当)2(212-+≤n n t t α时,接受H 。
3、多个正态总体均值的比较检验(方差分析)设k 个正态总体分别为),(21σμN ,),(22σμN ,…, ),(2σμk N 从k 个总体取i n 个独立样本如下:)()(2)(1)1(1)1(2)1(1k nkk k n X X X X X X考虑假设检验问题,:210k H μμμ=== j i j i H μμ≠≠使至少存在,:1假设0H 成立条件下,构造检验统计量为:)/()1/(k n SSE k SSA F --=),1(~k n k F -- 这里∑=-=ki ii X Xn SSA 12)(称为组间平方和;∑∑==-=k i i i j n j X X SSE i12)(1)(称为组内平方和;∑∑==-=ki i jn j X XSST i12)(1)(称为总平方和。
其中=i X ∑=nj i jiXn 1)(1,=X ∑∑==k i n j i j X n 11)(1k n n n n ++=21给定检验水平α,查F 分布表,使{}αα=>F F P ,可确定出临界值αF ,再利用样本值计算出F 值,若>F αF ,则拒绝0H ,否则不能拒绝0H 。
附注:多元假设检验与SAS 过程本章的主要内容是多元假设检验和方差分析,其中的计算一般都很复杂,可用国际上著名的专业软件——SAS 软件计算。
SAS 中有GLM ,ANOVA 和NESTED 等过程可用方差分析。
其中GLM 过程最常用。
SAS 的GLM 过程采用了一般线性模型:ε++++=m m x b x b b y (110)在方差分析问题中,变量 m x x ...1是示性变量,即只取0或1的变量。
GLM 过程对每一因子的每一水平,通过CLASS 语句产生1个示性变量,也称分类变量。
GLM 过程主要有四个语句:PROC GLM ,CLASS ,MODEL 和LSMEANS 语句。
PROC GLM 语句 用以调用GLM 过程,有许多选项,一般形式是: Proc glm [data=数据集名称] [outstat=输出的统计量][order=formatted|freq|data|internal];CLASS 语句 说明哪些变量是分类变量。
方差分析中的因素都是分类变量,如: Class V1 V2 V3;此语句指示计算机把因子V1,V2 ,V3作为分类变量,可以是字符型变量或数字型变量。
如果是字符型变量,长度限于10个字符以内。
MODEL 语句 语句中等号前是响应变量,如: Model Y=A ; 单因子ANOVA Model Y=A B C ; 主效应模型Model Y=A B A*B ; 含交互效应的因子模型 Model Y1 Y2=A B ; 多因子方差模型MANOVA LSMEANS 语句 用以求待估参数的最小二乘估计。
Lsmeans A B A*B ;MANOVA 语句 用以说明是做多元方差分析。
3.2 均值等于常数向量的检验在经济生产、管理决策中的很多实际问题,通常要选取多个指标进行考察,根据历史数据,将p 项指标的历史平均水平记作0 ,考虑新的p 项指标平均值是否与历史数据记载的平均值有明显差异?若有差异,进一步分析差异主要在哪些指标上,先看下面的实例:例3.1测量20名健康女性排汗量1x 、钠含量2x 、钾含量3x 得表3.1。
问健康女性1x 、2x 、3x 的均值是不是4、50、10?表3-1 20名健康女性排汗量1x 、钠含量2x 、钾含量3x 数据例3.1的数学模型就是:)',,(321x x x x =服从),(∑μN 要根据20个样品做复合检验:⎥⎥⎦⎤⎢⎢⎣⎡≠⎥⎥⎦⎤⎢⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡10504:,10504:32113210μμμμμμH H一般的,我们考虑p 维正态分布均值等于常数的检验问题:n X X X ,,,21 为取自p 维正态总体),(1∑μp N 的一个样本,要检验:0100:;:μμμμ≠=H H , (3.4)其中0μ为已知p 维向量。
对于这样一个检验问题,分为以下两种情形: 一、协方差阵∑已知条件下,均值μ的检验作出假设后,需要构造一个合适的统计量。
要检验的假设在形式上同一维情形是一样的。
0100:;:μμμμ≠=H H在一维时构造的统计量为n X U 0σμ-=且在0H 成立时,U 服从正态分布)1,0(N 。