当前位置:文档之家› 01第一节 显著性检验的基本原理

01第一节 显著性检验的基本原理

第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。

随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数=9.2头,标准差S2=1.549头。

能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。

这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。

由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。

造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。

对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。

如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。

两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。

这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。

因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。

例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。

由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。

为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和∑(-)2最小。

说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。

2、样本平均数是总体平均数的无偏估计值,即E()=μ。

3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。

所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。

由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。

若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。

通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。

所以观测值由两部分组成,即= +。

总体平均数反映了总体特征,表示误差。

若样本含量为,则可得到个观测值:,,,。

于是样本平均数===+。

说明样本平均数并非总体平均数,它还包含试验误差的成分。

对于接受不同处理的两个样本来说,则有:=+,=+。

这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。

也就是说样本平均数的差(-)包含有试验误差,它只是试验的表面效应。

因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。

只有通过显著性检验才能从(-)中提取结论。

对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。

虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。

所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。

为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。

只有从正确、完整而又足够的资料中才能获得可靠的结论。

若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。

因此,收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。

二、显著性检验的基本步骤仍以前面所举实例说明显著性检验的基本步骤。

(一)首先对试验样本所在的总体作假设这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为无效假设(nullhypothesis),记作:=或-=0。

无效假设是被检验的假设,通过检验可能被接受,也可能被否定。

提出:=或-=0的同时,相应地提出一对应假设,称为备择假设(alternativehypothesis),记作。

备择假设是在无效假设被否定时准备接受的假设。

本例的备择假设是:≠或-≠0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或与之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。

(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。

经统计学研究,得到一个统计量t:其中=叫做均数差异标准误;、为两样本的含量。

所得的统计量t服从自由度df=(-1)+(-1)的分布。

根据两个样本的数据,计算得:-=11-9.2=1.8;===0.742==2.426我们需进一步估计出|t|≥2.426的两尾概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(-1)+(-1)=(10-1)+(10-1)=18时,两尾概率为0.05的临界值:=2.101,两尾概率为0.01的临界t值:=2.878,即:P(|t|>2.101)=P(t>2.101)+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)+P(t<-2.878)=0.01由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.05<2.426<t0.01所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。

如图5-1所示,说明无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.01─0.05之间。

(三)根据“小概率事件实际不可能性原理”否定或接受无效假设上章曾论及:若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。

根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:=,接受备择假设:≠,即认为:试验的处理效应是存在的。

当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设:=成立的可能性大,不能被否定,因而也就不能接受备择假设:≠。

本例中,按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,从而接受:≠。

可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数和不相同。

综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。

对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的统计推断是不可忽视的。

三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。

用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作。

在生物学研究中常取=0.05或=0.01。

对于上述例子所用的检验方法(t检验)来说,若|t|<,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“”或不标记符号;若≤|t|<,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;若|t|≥,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。

这里可以看到,是否否定无效假设:=,是用实际计算出的检验统计量t 的绝对值与显著水平对应的临界t值比较。

若|t|≥,则在水平上否定:=;若|t|<,则不能在水平上否定:=。

区间和称为水平上的否定域,而区间(-,)则称为水平上的接受域。

假设检验时选用的显著水平,除=0.05和0.01为常用外,也可选=0.10或=0.001等等。

到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。

如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。

反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。

显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。

因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。

也就是说,在检验无效假设时可能犯两类错误。

第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)。

Ⅰ型错误,就是把非真实差异错判为真实差异,即:=为真,却接受了:≠。

第二类错误是不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)。

Ⅱ型错误,就是把真实差异错判为非真实差异,即:≠为真,却未能否定:=。

我们是基于“小概率事件实际不可能性原理”来否定,但在一次试验中小概率事件并不是绝对不会发生的。

如果我们抽得一个样本,它虽然来自与对应的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了,于是犯了Ⅰ型错误。

但犯这类错误的概率不会超过。

Ⅱ型错误发生的原因可以用图5-2来说明。

相关主题