当前位置:文档之家› 第五章假设检验

第五章假设检验

第五章 假设检验第一节 假设检验中的基本概念和基本原理一、统计假设的概念统计假设,指的是和抽样手段联系在一起,并且依靠抽样数据来进行验证的假设。

统计假设的内容都是数量化了的,而且验证的依据都是凭借抽样调查所取得的资料,在抽取样本资料时,必须保证抽样的随机性。

假设⎩⎨⎧H H 10备择假设原假设原假设,又称为零假设。

它一般是根据已有的资料,或经过周密考虑后确定的、具有稳定性的、受保护的经验和看法。

因此,若没有充分根据, H 0是不会被轻易否定的。

备择假设,又称为研究假设。

经过抽样调查,若有充分根据否定原假设H 0,自然就得接受其逻辑对立面。

原假设H 0的逻辑对立面即为备择假设。

以总体均值μ的假设检验为例,根据问题的不同,假设检验可能有三种: 1、双边检验 H 0:μμ0=H1:μμ0≠2、右侧单边检验 H 0:μμ0=H1:μ>μ03、左侧单边检验 H 0:μμ0=H1:μ<μ二、假设检验的基本原理——小概率原理小概率原理可归纳为两个方面:一是可以认为小概率事件在一次观察中是不可能出现的;二是如果在一次观察中出现了小概率事件,那么,合理的想法是否定原来认为该事件具有小概率的看法。

假设检验的基本思想:经过随机抽样获得一个来自总体的样本,然后根据样本计算某个(或某几个)统计量的数值。

若在原假设H 0成立的条件下,该统计量数值的出现几乎是不可能的,就拒绝或否定原假设H 0,并接受它的逻辑对立面——备择假设H 1。

反之,如果在原假设H 0成立的条件下,该统计量数值出现的可能性不是很小的话,就没有理由拒绝原假设H 0。

三、假设检验中的统计量1、在原假设H 0成立的情况下,统计量中不应包含有未知参数,其数值应该是确定的。

2、所选用的统计量的分布应该是已知的,是有表可查的。

例如,对于正态总体均值μ的检验H 0:μμ0=,应选择的统计量为: =Z nX σμ-(σ2已知) t =nS X μ-(σ2未知)四、显著性水平α显著性水平α是假设检验中所规定的小概率的数量界限。

也就是在原假设H 0成立的条件下,判断统计量数值的出现是否是小概率事件的标准。

常用的标准有:05.0,1.0==αα或01.0=α。

五、临界值、接受域和拒绝域选定一个检验统计量后,在原假设H 0成立的条件下,就可画出统计量的分布。

再根据给定的显著性水平α,就可确定临界值、接受域和拒绝域。

比如,对于正态总体均值μ的双边检验H 0:μμ0=,在总体方差σ2已知的情况下,我们选择=Z nX σμ-为统计量;根据原假设H 0:μμ0=,就可以画出如图5-1-1所示的Z 统计量的分布。

图5-1-1 Z 统计量的分布由于双边检验把拒绝原假设H 0的小概率事件定在了统计量分布的两侧,因此,两侧尾部面积总和所代表的概率即为显著性水平α。

又由于Z 统计量的分布是对称的,所以每侧的概率都是2α。

查标准正态分布表可得:2)(αα=>Z Z P ,2)(2αα=-<Z Z P即 )(22Z Z Z P αα<<-= α-1根据假设检验的小概率原理,如果统计量的值Z Z Z Z c c 22αα-<>或,就应拒绝原假设H;反之,若统计量的值Z Z Z c 2αα<<-,就应接受原假设H 0。

因此,该双边检验以Z Z 22αα和-为临界值,两者之间的区域为接受域,两边为拒绝域。

六、双边检验和单边检验 (一)双边检验双边检验的假设形式为:H 0:μμ0=←→H 1:μμ0≠双边检验的拒绝域被定在了统计量分布的两侧。

若给定的显著性水平为α,则每侧拒绝域的概率应各为2α。

假定所选统计量为Z 统计量,则临界值Z 2α和显著性水平α有如下的关系式:)(22Z Z Z P αα<<-=α-1也就是说,该双边检验的拒绝域为:Z Z Z Z 22αα-<>或,如图5-1-3所示。

图5-1-3 双边检验的接受域、拒绝域(二)单边检验 l.右侧单边检验右侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0>右侧单边检验把拒绝域定在了统计量分布的右侧。

若给定的显著性水平为α,则统计量分布右尾的概率应为α。

假定所选统计量为Z 统计量,则临界值Z α和显著性水平α有如下的关系式:αα=>)(Z Z P也就是说,该右侧单边检验的拒绝域为:Z Z α>,如图5-1-4所示。

图5-1-4 右侧单边检验的接受域、拒绝域2.左侧单边检验左侧单边检验的假设形式为:H 0:μμ0=←→H 1:μμ0<左侧单边检验把拒绝域定在了统计量分布的左侧。

若给定的显著性水平为α,则统计量分布左尾的概率应为α。

假定所选统计量为Z 统计量,则临界值-Z α和显著性水平α有如下的关系式:αα=-<)(Z Z P也就是说,该左侧单边检验的拒绝域为:Z Z α-<,如图5-1-5所示。

图5-1-5 左侧单边检验的接受域、拒绝域第二节 假设检验的步骤和两类错误一、假设检验的步骤1、根据实际问题作出假设,包括原假设H 0和备择假设H 1两部分;2、根据样本构造合适的统计量,并在原假设H 0成立的条件下确定统计量的分布;3、根据有关要求给定显著性水平α,并根据统计量的分布求出拒绝域和临界值;4、根据样本统计量的观测值进行判断。

若样本统计量的值落入统计量分布的拒绝域,则拒绝原假设H 0,接受备择假设H 1;反之,则接受H 0。

二、假设检验的两类错误 1、弃真错误弃真错误,又称为第一类错误,指的是否定了未知的真实状态,把正确的原假设H 0当成了假的而加以拒绝的错误。

这是在拒绝原假设H 0时可能出现的错误。

犯弃真错误的概率就是显著性水平α。

2、纳伪错误纳伪错误,又称为第二类错误,指的是接受了未知的不真实状态,把错误的原假设H 0当成了真的而加以接受的错误。

这是在接受原假设H 0时可能出现的错误。

犯纳伪错误的概率β的大小是不确定的。

它的数值大小取决于真实的μ和原假设中的μ的偏离程度△μμμ0-=。

μ∆越小, 犯纳伪错误的概率β越大;反之,△μ越大,β的数值就越小。

(β——下图中阴影部分的面积)在样本容量n 一定的情况下, 不可能同时减小犯两类错误的概率βα和。

要想同时减小犯两类错误的概率,就只能增加样本容量n 。

第三节 单总体假设检验一、大样本假设检验(一)大样本总体均值μ的假设检验在大样本情况下,总体均值μ的假设检验的统计量为:σμμσXX nX Z 0-=-=1、双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 2αα-<>或 )2、右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )3、左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-1 大样本总体均值μ的假设检验例、某部门统计报表显示,该部门职工的人均月收入为1500元。

为检查统计报表的正确性,在该部门职工中抽查了60人,抽查结果为:元,1520=X 36=S 元,问该部门统计报表中的人均月收入是否正确(05.0=α)?解:本问题是在=α0.05下检验假设:H 0:1500=μ←→H 1:1500≠μ。

由于是大样本,所以应选用=Z ns X μ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。

查标准正态分布表可得Z Z 025.02=α=1.96。

因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。

根据抽样结果有,6036150015200-=-=nX Z σμ=4.303>1.96所以,拒绝原假设H 0,认为该部门的报表中的人均月收入不正确。

由假设检验的原理及方法可知,假设检验与区间估计其实是同一个问题的两种不同的表述方法,假设检验的接受域也正是区间估计的置信区间。

(二)大样本总体成数P 的假设检验大样本总体成数p 的假设检验的统计量为:nP Z P P P )1(ˆ0--=1、双边检验H:PP 0=H 1:PP 0≠( 拒绝域为:Z ZZ Z 22αα-<>或 )2、右侧单边检验H 0:P P 0=H1:PP 0>( 拒绝域为:Z Z α> )3、左侧单边检验H 0:P P 0=H1:PP 0<( 拒绝域为:Z Z α-< )图5-3-2 大样本总体成数P 的假设检验例、某县近年的高考升学率都保持在30%左右,为提高升学率,该县各校进行了一系列的教学改革。

为检查改革的成效,在该县今年的应届毕业生中抽查了100人,结果有38人考上大学。

请问该县各校的一系列教学改革是否取得成效(05.0=α)?解:本问题是在=α0.05下检验假设:H:%30=P ←→H 1:%30>P由于是大样本,所以应选用σPP PnpqP P Z ˆˆˆ-=-=作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。

查标准正态分布表可得Z Z 05.0=α=1.645。

因此,该右侧单边检验的拒绝域为:645.1>Z 。

根据有关数据,得 nP Z P P P )1(ˆ0--==100%70%30%30%38⨯-=1.746>1.645所以,拒绝原假设H 0,认为该县的教学改革取得了成效。

二、小样本假设检验在小样本情况下,检验统计量的分布与总体分布有关。

(一)单正态总体),(2σμN 的均值检验 1、σ2已知总体均值μ的假设检验的统计量为: σμμσXX nX Z 0-=-=(1)双边检验H 0:μμ0=H1:μμ0≠( 拒绝域为:Z Z Z Z 22αα-<>或 )(2)右侧单边检验H 0:μμ0=H1:μ>μ( 拒绝域为:Z Z α> )(3)左侧单边检验H 0:μμ0=H1:μ<μ( 拒绝域为:Z Z α-< )图5-3-3 单正态总体均值μ的假设检验(σ2已知)例、某厂生产的某种螺栓的直径(单位:mm )服从正态分布),20(2.12N ,设备维修后,从新生产的产品中随机抽查20个,测得X =21mm 。

若方差没有发生变化,问设备维修后,螺栓的直径有没有显著变化(05.0=α)?解:本问题是在=α0.05下检验假设:H:20=μ←→H 1:20≠μ由于是正态总体及小样本,且σ2已知,所以应选用=Z nX σμ-作为检验统计量,在H 0成立的条件下,Z ~)1,0(N 。

查标准正态分布表可得Z Z 025.02=α=1.96。

因此,该双边检验的拒绝域为:96.196.1-<>Z Z 或。

根据抽样数据,可得 202.120210-=-=nX Z σμ=3.727>1.96 所以,拒绝原假设H 0,认为设备维修后螺栓的直径发生了变化。

相关主题