当前位置:文档之家› 统计学第七章假设检验教学指导与习题解答

统计学第七章假设检验教学指导与习题解答

第七章 假设检验Ⅰ.学习目的假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。

通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。

Ⅱ.课程内容要点 第一节 假设检验的基本原理一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。

事先所做的假设,是假设检验中关键的一项工作。

它包括原假设和备选假设两部分。

原假设是建立在假定原来总体参数没有发生变化的基础之上的。

备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。

二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤:(1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;(3)给定检验的显著性水平α。

在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;(4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。

从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。

拒绝域正是统计量取值的小概率区域。

按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。

双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。

对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。

在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。

p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。

如果该值小于α,否定原假设,取对应的备选假设。

如果该值大于α,我们不就能否定原假设。

2、两类错误H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。

通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。

由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。

三、检验功效-可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β验功效。

它的数值表明我们做出正确决策的概率为1β-。

解决增强检验功效的唯一办法只有增大样本容量,这样既能保证满足取得较小的α,又能取得较小的β值。

第二节 总体参数假设检验一、总体均值的假设检验 1、总体方差2σ已知对于双侧检验,建立的假设为:0010:,:H H μμμμ=≠对于左(右)单侧检验来说,建立的假设为:0010:,:(H H μμμμ=<或>)检验统计量X z =~(0,1)N原假设的拒绝域为:样本统计量的值z 满足:12z zα->(双侧检验);1z z α-<-(左单侧检验);1z z α->(右单侧检验)。

当z 值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。

2、总体方差2σ未知对于双侧检验,建立的假设为:0010:,:H H μμμμ=≠ 对于左(右)单侧检验来说,建立的假设为:0010:,:(H H μμμμ=<或>)检验统计量X t =~(1)t n -,其中221()1ni i X X s n =-=-∑为样本标准差。

原假设的拒绝域为:样本统计量的值t 满足12(1)t tn α->-(双侧检验);1(1)t t n α-<--(左单侧检验);1(1)t t n α->-(右单侧检验)。

当t 值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。

二、两个总体均值之差的检验1、两总体方差22X Yσσ、已知 ⑴ 双侧检验原假设为:0:X Y H μμ=,备选假设为1:X Y H μμ≠检验统计量:X Yz =~(0,1)N 。

该检验的否定域:12z zα->。

反之不能拒绝原假设。

⑵ 左单侧检验原假设与双侧一样,备选假设为1:X Y H μμ< 检验的否定域为:计算的样本统计量满足:1z z α-<- (3) 右单侧检验原假设与双侧一样,备选假设为1:X Y H μμ> 检验的否定域为:计算的样本统计量满足:1z z α->2、两总体方差22X Yσσ、未知但相等 双、单侧检验的原假设都相同,均为0:X Y H μμ=。

只是在双侧检验时,备选假设1:X Y H μμ≠;在左单侧检验时,备选假设为1:X Y H μμ<;在右单侧检验时,备选假设为1:X Y H μμ>。

检验统计量:X Yt =12(2)t n n +-。

对于双侧检验,原假设的拒绝域为:12t tα->。

反之就不能拒绝原假设。

对于左、右单侧检验,左单侧检验拒绝原假设的范围是:112(2)t t n n α-<-+-。

右单侧检验拒绝原假设的范围为:112(2)t t n n α->+-。

三、总体成数的假设检验1、单样本成数检验建立假设:0010:,:H P H P ρρ=≠检验统计量z =~(0,1)N 。

将样本统计量与临界值进行比较,若12z z α->,则否定原假设;反之则不能拒绝原假设。

当然,如果对应的原假设是单边的,即为00:()H P ρ≥≤或。

对应的临界值应该是1z α-,其余的计算和判断规则如上面所述。

2、两个样本总体成数差的检验检验统计量(0,1)z N =。

若建立的原假设为:012:H ρρ=,相应的临界值为12zα-;而如果建立的原假设为:012:()H ρρ≥≤或,相应的临界值为1z α-。

能否拒绝原假设的判断规则如前面所述。

四、正态总体方差的假设检验原假设为2200H σσ=:,备选假设:2210()H σσ≠≥≤:或者检验统计量 22212(1)n n s χχσ--=五、两个正态总体方差比的检验 1、两总体均值X Y μμ、已知检验统计量2122(,)XYs F F n n s =,其中122111()n Xi X i s X n μ==-∑ ;222121()n Yi Y i s Y n μ==-∑。

原假设为:220X Y H σσ=:。

对于双侧检验,备选假设为:221X Y H σσ≠:,若()()1212122,,F F n n F Fn n αα-<>或则拒绝原假设,反之,则不能拒绝原假设。

对于左单侧检验: 备选假设:221X Y H σσ≥:,拒绝域为样本统计量()12,F F n n α<。

对于右单侧检验:备选假设:221X YH σσ≤:,拒绝域为样本统计量()112,F F n n α->。

2、两样本均值X Y μμ、未知建立的原假设为:220X Y H σσ=:,检验统计量2122(1,1)XYS F F n n S =--,其中122111()1n Xi i S X X n ==--∑和222121()1n Yi i S Y Y n ==--∑。

对于双侧检验:备选假设:221X YH σσ≠:,当样本统计量122(1,1)F F n n α<--或1212(1,1)F Fn n α->--时,我们就拒绝原假设,反之不能拒绝原假设。

对于左单侧检验:建立的备选假设:221X YH σσ≥:,供判断的临界值为12(1,1)F n n α--,拒绝域为样本统计量()121,1F F n n α<--。

对于右单侧检验:建立的备选假设:221X YH σσ≤:,供判断的临界值为112(1,1)F n n α---,拒绝域为样本统计量()1121,1F F n n α->--。

第三节 非参数检验一、非参数检验概述实际问题中,可能无法获知或者是不一定很了解总体的分布类型,而只是通过样本来检验关于总体分布的假设。

这种检验方法称为非参数检验。

非参数检验与传统的参数检验比较有一些优缺点;对检验的限制更少,更加避免先见偏差,具有较好的稳健性;可以在更少样本资料要求的情况下进行,在一定程度上弥补有些实际中样本资料不足等的缺陷;可以弥补上述参数检验中碰到的无法运用的属性资料问题,然而,同时也就可能损失了其中所包含的另外信息。

二、2χ检验2χ检验是利用2χ分布的原理,通过对样本数据进行分析来对样本所属的总体情况进行判断的一种检验方法。

1.分布拟合检验原假设为:0010:()(),:()()H F X F X H F X F X =≠。

其中()F X 为总体的分布函数,0()F X 是某个事先假定的总体分布函数。

检验统计量:221()mi i i i f np np χ=-=∑~2(1)m k χ--。

其中i f 为各个样本区间内的实际频数,11()()()i i i i i p P X x X F X F X --=<<=-为落在各个区间的理论概率值,k 为待估计的参数个数。

拒绝原假设的值域:22(1)m k αχχ>--,如果样本统计量2χ大于2(1)m k αχ--,那么就可以拒绝原假设,否则不能拒绝原假设。

2.独立性检验该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。

我们这里的变量主要是定类、定序的资料。

为了分析变量之间的关联性,我们需要将资料整理成列联表的形式。

列联表是多行多列纵横交错所形成的一个表体。

三、符号检验1.单样本的符合检验在单样本的情况下,符号检验适用于检验总体中位数是否在某一指定的位置。

中位数检验的基本原理是,假设总体中位数的真值e M A =,然后在实际抽取的容量为n 的样本中,将每个观测值(1)i x i n ≤≤均减去A ,并只记录其差值的符合,即为()i i i x Asign x A x A+>⎧-=⎨-<⎩当当。

若i x A =,就略去不计。

接着分别计算“+”的个数(用n +表示)和“-”的个数(用n -表示)。

理论上,当中位数e M A =为真时,得到的正负号个数应该接近相等,即n n +-≈。

若从样本中得到的n +和n -相差较远,那么就有理由拒绝e M A =。

相关主题