显著性检验(Significance T esting)显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。
或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。
显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。
抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
[编辑]显著性检验的含义显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。
常把一个要检验的假设记作H0,称为原假设(或零假设) (null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis) 。
⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。
通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。
这样的假设检验又称为显著性检验,概率α称为显著性水平。
最常用的α值为0.01、0.05、0.10等。
一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误,α取值小些,反之,α取值大些。
[编辑]显著性检验的原理无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。
所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。
经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。
若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。
“无效假设”成立的机率水平检验“无效假设”成立的机率水平一般定为5%(常写为p≤0.05),其含义是将同一实验重复100次,两者结果间的差异有5次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p>0.05。
若两者结果间的差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为p≤0.05。
如果p≤0.01,则认为两组间的差异为非常显著。
[编辑]显著性检验的相关概念[编辑]原假设和备择假设1、原假设:对总体所作的论断或推测,指观察到的差异只反映机会变异。
记作H0。
2、备择假设:是指观察到的差异是真实的。
记作H1。
3、原假设和备择假设合在一起,应涵盖我们所研究的总体特征的所有可能性。
[编辑]双尾检验和单尾检验采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取决于备择假设的形式。
表1:拒绝域的单、双尾与备择假设之间的对应关系(([编辑]显著性检验的作用分析工作者常常用标准方法与自己所用的分析方法进行对照试验,然后用统计学方法检验两种结果是否存在显著性差异。
若存在显著性差异而又肯定测定过程中没有错误,可以认定自己所用的方法有不完善之处,即存在较大的系统误差。
因此分析结果的差异需进行统计检验或显著性检验。
[编辑]显著性检验的基本思想显著性检验的基本思想可以用小概率原理来解释。
1、小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件事实上发生了。
那只能认为事件不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。
2、观察到的显著水平:由样本资料计算出来的检验统计量观察值所截取的尾部面积为。
这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。
3、检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。
4、在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。
大于这个标准时,拒绝原假设的证据不足,认为样本数据不足以表明真实差异存在。
5、检验的操作可以用稍许简便一点的作法:根据所提出的显著水平查表得到相应的值,称作临界值,直接用检验统计量的观察值与临界值作比较,观察值落在临界值所划定的尾部内,便拒绝原假设;观察值落在临界值所划定的尾部之外,则认为拒绝原假设的证据不足。
[编辑]显著性检验的两类错误1、显著性检验中的第一类错误及其概率显著性检验中的第一类错误是指,原假设H0:θ = θ0事实上正确,可是检验统计量的观察值却落入拒绝域,因而否定了本来正确的假设。
这是弃真的错误。
发生第一类错误的概率(记作)也就是当原假设H0:θ = θ0正确时检验统计量的观察值落入拒绝域的概率。
显然,在双尾检验时是两个尾部的拒绝域面积之和;在单尾检验时是单尾拒绝域的面积。
2、显著性检验中的第二类错误及其概率显著性检验中的第二类错误是指,原假设H0:θ = θ0不正确,而备择假设H1:θ < θ0或H1:θ > θ0是正确的,可是检验统计量的观察值却落入了接受域,因而没有否定本来不正确的原假设。
这是取伪的错误。
发生第二类错误的概率(记作)是指,把来自的总体的样本值代入检验统计量所得结果落入接受域的概率。
3、α和β的关系当样本容量一定时,α越小,β就越大;反之,α越大,β就越小。
[编辑]显著性检验的P值[1]若用计算机统计软件进行假设检验, 我们会见到P—值。
将算得检验统计量样本值查表得的概率是就是P值(在那里我们称之为观察到的显著水平)。
P值是怎么来的从某总体中抽样所得的样本,其参数会与总体参数有所不同,这可能是由于两种原因:⑴、这一样本是由该总体抽出,其差别是由抽样误差所致;⑵、这一样本不是从该总体抽出,所以有所不同。
如何判断是那种原因呢?统计学中用显著性检验赖判断。
其步骤是:⑴、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。
⑵、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。
⑶、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。
如果P>0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P<0.05或P <0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受令一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。
统计学上规定的P值意义见下表理解P值,下述几点必须注意:⑴P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。
因此,与对照组相比,C药取得P<0.05,D药取得P <0.01并不表示D的药效比C强。
⑵ P>0.05时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。
在药效统计分析中,更不表示两药等效。
哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。
⑶统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P <0.001,无此必要。
⑷显著性检验只是统计结论。
判断差别还要根据专业知识。
[编辑]显著性检验的结果关于显著性检验的结果:(一)显著性检验回答什么问题我们所观察到的差异(是纯属于机会变异,还是反映了真实的差异?1、如果显著性检验得到差异显著的结论这时并不能评价差异的大小和重要性。
2、显著性检验只能告诉我们差异是否在事实上存在,而不能回答差异产生的原因。
3、显著性检验不能检查我们对实验所作的设计是否有缺陷(二)显著性检验回答问题的方式在表述显著性检验结论的时候,应与检验的逻辑推理相符。
当检验统计量的观察值落在拒绝域时,我们应该说,样本资料显著地(或高度显著地)表明,差异是存在的。
(三)对观察到的显著水平数值的评价[编辑]显著性检验中的总体和样本1、显著性检验的对象是无限总体。
2、大样本可能会使检验统计量过分敏感。
3、从有限总体中抽取样本用于显著性检验时,必须作概率抽样。
[编辑]显著性检验的步骤显著性检验的一般步骤或格式,如下:1、提出假设H0:______H1:______同时,与备择假设相应,指出所作检验为双尾检验还是左单尾或右单尾检验。
2、构造检验统计量,收集样本数据,计算检验统计量的样本观察值。
3、根据所提出的显著水平,确定临界值和拒绝域。
4、作出检验决策。
把检验统计量的样本观察值和临界值比较,或者把观察到的显著水平与显著水平标准比较;最后按检验规则作出检验决策。
当样本值落入拒绝域时,表述成:“拒绝原假设”,“显著表明真实的差异存在”;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假设”,“没有充足的理由表明真实的差异存在”。
另外,在表述结论之后应当注明所用的显著水平。
[编辑]总体均值为某定值的显著性检验总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情况。
下面就总体分布的不同情况,总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。
一、总体为正态分布,总体方差已知,样本不论大小对于假设:H0:μ = μ0,在H0成立的前提下,有检验统计量如果规定显著性水平为,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:①和;②;③。
二、总体分布未知,总体方差已知,大样本对于假设H0:μ = μ0,在H0成立的前提下,如果样本足够大(n≥30),近似地有检验统计量如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为①和;②;③。
三、总体为正态分布,总体方差未知,小样本对于假设H0:μ = μ0,在H0成立的前提下,有检验统计量如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:①和;②;③。
四、总体分布未知,总体方差未知,大样本对于假设H0:μ = μ0,在H0成立的前提下,如果总体偏斜适度,且样本足够大,近似地有检验统计量如果规定显著性水平为a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:①和;②;③[编辑]总体比例为某定值的显著性检验总体比例指的是随机试验中某种指定事件出现的概率。
随机试验中某种指定事件出现叫做“成功”,把一次试验中成功的概率记作π。
对于假设H0:π = π0,在H0成立的前提下,如果,并且样本容量足够大,大到足以满足时,近似地有检验统计量其中p是样本比例。