当前位置:文档之家› 假设检验新知识点

假设检验新知识点

假设检验新知识点(总6页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--假设检验一、假设检验的概念统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。

假设检验过去亦称显著性检验(significance test)。

其基本原理和步骤用以下实例说明。

例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。

某医生在一山区随机抽查了 25名健康成年男子,求得其脉搏的均数为 74.2次/分,标准差为6.0次/分。

根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数本例可用下图表示。

显然,本例其目的是判断是否μ>μ0。

从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二:①非同一总体,即μ#μ0;②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。

假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。

也就是说,是解决样本均数代表性如何的问题。

上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。

假设检验也是统计分析的重要组成部分。

(提问:统计分析包括参数估计和假设检验)下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。

假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t 检验、F检验、X2检验等。

后面有进一步介绍。

二、假设检验的基本步骤建立检验假设(一)建立假设假设有两种:一种是检验假设,常称无效假设,用 H0表示。

这种假设的含义是假设两个指标(样本指标与总体指标、或两个样本指标)是相等的,它们的差别是由于抽样误差引起的。

另一种是备择假设,常称对立假设,常用H1表示,是与H0相对立的假设,假设两个指标不相等,它们的差别不是由于抽样误差引起的,若无效假设被否决则该假设成立。

根据计算出的检验统计量,查相应的界值表即可得概率P。

如上例,算得t=1.833,查表14-16,t界值表,先从横标目找到自由度υ=24一行,1. 833在界值与2.064之间,相对应纵标目的单尾P值分别为0.05与,得本例0.025< P< 0.05;余类推。

将获得的事后概率P,与事先规定的概率——检验水准α进行比较而得出结论。

一般来说,推断的结论应包含统计结论和专业结论两部分。

统计结论只说明有统计学意义(statistical significance)或无统计学意义(statistical significance),而不能说明专业上的差异大小。

它必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。

若P≤α,则结论为按所取的α检验水准,拒绝H0,接受H1,差别有统计学意义(统计结论),可认为……不同或不等(专业结论)。

如例题得到0.025<P<0.05,按所取检验水准0.05,则拒绝H0,接受H1,有统计学意义,可认为该山区健康成年男子脉搏均数高于一般健康成年男子。

若P>a,则结论为按α检验水准,不拒绝H。

,无统计学意义(统计结论),还不能认为……不同或不等(专业结论)。

P>α过去称“无显著性”,在文献中常用 NS(non- significant/no- significant。

)表示,也就是人们常说的“阴性结论”。

注意:①虽然否定之否定为肯定,但不拒绝H0不等于完全接受H。

,此时,尚没有足够的证据认为H。

成立。

从决策的观点:可认为暂时“接受”它,或“阴性待观察”。

②下结论时,对H0只能说:拒绝(reject)或不拒绝(not reject);而对 H1只能说:接受 H1,除此之外的其它说法均不妥当。

三.计量资料的假设检验假设检验的具体方法,通常以选定的检验统计量来命名。

如检验统计量t和u分别对应于t检验(t-test,亦称Student’s t-test)和 u检验(u-test,亦称 Z-test)。

假设检验方法的选择应根据不同的资料类型和性质,研究的目的等来确定。

实际应用时,应弄清各种检验方法的用途、适用条件和注意事项。

前面我们学过,统计资料可分为计量资料、计数资料和等级资料三种,这三种不同类型的资料都有其相应的假设检验方法:计量资料:常用t检验(u检验)、F检验(方差分析)等;计数资料:X2检验等;等级资料:秩和检验。

我们首先学习计量资料的假设检验。

同样是计量资料,还有不同的检验方法,这主要是要根据具体的资料内容的研究目的来确定。

一般来说,两均数比较用t检验,而两个以上均数的比较就必须用方差分析了。

t检验的应用条件:当样本含量n较小时(如n<= 50,理论上要求样本取自正态总体,两小样本均数比较时还要求两样本总体方差相等。

但在实际应用时,与上述条件略有偏离,只要其分布为单峰近似对称分布,则对结果亦影响不大。

u检验的应用条件:样本含量n较大, 一般要求n>50。

其实,u检验和t检验都属同类,其方法步骤也基本相同,不同的地方仅在于确定P值时界值的选择。

(一)样本均数与总体均数比较的t检验下面我们以例题提出的问题为例,学习假设检验的一般步骤方法、掌握样本均数与总体均数比较的t检验的过程。

在例题中,某医生在一山区随机抽查了 25名健康成年男子,其脉搏的均数为 74.2次/分,标准差为6.0次/分,这是一个样本。

而已知的一般健康成人脉搏均数72次/分可作为总体均数。

这是一个样本均数与已知总体均数比较的问题,故选用t检验方法。

(有的同学会问,不是说总体均数一般为未知的吗是的,但医学上也有一些数据比较稳定、经过长时间研究应用的常数,如医学正常值、理论值、标准值,这些有时可作为总体均数来应用。

)①建立检验假设,确定检验水准H0:µ=µ0,即山区成年男子平均脉搏数与一般成年男子相等H1:µ>µ0,即山区成年男子平均脉搏数高于一般成年男子α=0.05③选定检验方法,计算检验统计量因该例为计量资料且 n=25<50,故选用样本均数与总体均数比较的 t检验。

已知 X=74.2次/分,S=6.0次/分,按下式计算统计量: t=(X-µ)/s x=④确定P值按自由度υ=n-1=25-1=24查t界值表得:单侧,24=; ,24= ,24=<t< ,24故单侧<P<。

⑤统计推断,下结论因<P<,按α=的水准拒绝H0,接受H1,差别有统计学意义。

可认为该山区健康成年男子脉搏数高于一般成年男子。

这个例题是一个单侧t检验,就是说研究者只关心山区健康成年男子脉搏数是否高于一般成年男子,并不认为相反结果会成立。

但是医学上的大部分研究都必须关心到正反两种结果,如一种新疗法与传统疗法的疗效比较等,所以,除非有确实必要或专业知识的要求,我们一般都要用双侧检验。

双侧检验和单侧检验的区别在于①建立假设时的叙述;②确定P值时查表是用单侧或是双侧(二)配对资料的t检验有以下两种不同的配对资料:①将实验对象配成对子,分别给予不同的处理,以推断两种处理是否有区别;②对同一实验对象,比较其处理前后的差别,以推断某种处理有无作用,如临床上病人治疗前后某个指标的对比。

(三)两样本均数的t检验又称成组t检验,适用于完全随机设计两样本均数的比较。

完全随机设计是分别从两个研究总体中随机抽取样本,对这两个样本均数进行比较,以推断它们所代表的总体是否一致。

其他的还有两大样本比较的u检验、两几何均数比较的t检验等。

这些检验思路、方法基本相同,只不过是计算统计量的公式不同而已。

四.假设检验应注意的问题(1)要有严密的研究设计,这是假设检验的前提。

组间应具可比性,也就是除对比的主要因素(如用新药和用安慰剂)外,其它可能影响结果的因素(如年龄,性别,病程,病情轻重等),在对比组间应尽可能相同或相近;应保证样本是从同质总体中随机抽取。

(2)不同变量或资料应选用不同的检验方法。

应根据分析目的、资料(变量)类型和分布、设计方案、样本含量大小等选用适当的检验方法。

如:配对设计的计量资料采用配对t检验,而完全随机的两样本定量(变量)资料,若为小样本(即任一组 n< 50)且方差齐,则选用两小样本t检验;若方差不齐,则选用近似t'检验(Cochran&Cox法或Satterthwaite法);若为大样本(每组n>50),则可选用大样本u检验。

(3)正确理解“显著性”一词的含义。

差别有统计学意义,过去称差别有“显著性”,不能理解为差异大。

假设检验的结果并不指差异的大小,只能反映两者是否相同或不同,因此一般采用“有无统计学意义”一词表达。

差异的大小只能根据专业知识予以确定。

(4)作结论不能绝对化。

因统计结论具有概率性质,不宜用“肯定”,“一定”,“必定”等词。

在报告结论时,最好应列出检验统计量的值,尽量写出P值的确切范围(并注明单侧还是双侧),如写成0.025<P<0.05,以便读者与同类研究进行比较。

(5) 统计“显著性”与医学/临床/生物学“显著性”(statistical vs medical/ clinical/ biological significance)。

统计“显著性”对应于统计结论,而医学/临床/生物学“显著性”对应于专业结论。

假设检验是为各专业服务的,统计结论必须和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。

若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。

当统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在严重的偏倚(偏性),那么最终结论则没有意义。

例如:有人欲比较A、B两种降压药物的降压效果,随机抽取了高血压病人各100名,分别测定两组病人服药后舒张压的改变值,得两组舒张压改变值之差的平均数为0.11kPa。

作两大样本u检验得u=6.306,P《0.001,有统计学意义。

但因A、B两组高血压病人服药后舒张压改变值之差较小,仅0.11kPa,不足有临床意义的差值0.67kPa,故最终结论并无实际意义。

相反,统计结论无意义,而专业结论被认为有意义,那就应当检查设计是否合理、统计分析方法应用是否恰当等等,并进一步加以验证。

小结t检验的基本步骤:①建立假设:H0、H1②确定检验水准:α=③计算统计量t:根据不同的资料选用相应的计算公式④查t值表,确定P值:t ≥ tα,υP≤αt ≤ tα,υP≥α⑤统计推断结论P>,接受H0,差别无显著意义;0.01<P≤,拒绝H0,接受H1,差别有显著意义;P≤ 拒绝H0,接受H1,差别有非常显著意义。

相关主题