当前位置:文档之家› 第八章假设检验的基本概念(ppt 52)

第八章假设检验的基本概念(ppt 52)


问题实质上都是希望通过样本统计量 与总体参数的差别,或两个样本统计 量的差别,来推断总体参数是否不同。 这种识别的过程,就是本章介绍的假 设检验(hypothesis test)。
2020年8月10日
例8–1 通过以往大规模调查,已知某地一般新 生儿的头围均数为34.50cm,标准差为1.99cm。 为研究某矿区新生儿的发育状况,现从该地某 矿区随机抽取新生儿55人,测得其头围均数为 33.89cm,问该矿区新生儿的头围总体均数与 一般新生儿头围总体均数是否不同?
2020年8月10日
1.建立检验假设,确定检验水准(选用单侧或双侧检验)
(1)无效假设又称零假设,记为 H0;
(2)备择假设又称对立假设,记为 H1。
对于检验假设,须注意:
① 检验假设是针对总体而言,而不是针对样本; ② H0 和 H1 是相互联系,对立的假设,后面的结论是 根据 H0 和 H1 作出的,因此两者不是可有可无,而是 缺一不可;
2P012201年例88月-210日
u X 0 171.2 168.5 4.70
S / n 5.3/ 85
检验界值u0.05/2 = 1.96,u0.01/2 = 2.58 ,u >u0.01/2, 得P<0.01,按α=0.05水 准,拒绝H0,接受H1,2003年当地 20岁应征男青年与1995年相比,差别 有统计学意义。可认为2003年当地20 岁应征男青年的身高有变化,比1995 年增高了。
抽样误差
X 33.89cn
总体不同
矿区新生儿头围
34.50cm
2020年8月10日
第二节 假设检验的基本步骤
2020年8月10日
例8–1 通过以往大规模调查,已知某地 一般新生儿的头围均数为34.50cm,标 准差为1.99cm。为研究某矿区新生儿的 发育状况,现从该地某矿区随机抽取新 生儿55人,测得其头围均数为33.89cm ,问该矿区新生儿的头围总体均数与一 般新生儿头围总体均数是否不同?
2020年8月10日
(3) 检验水准,过去称显著性水准,是预
先规定的概率值,它确定了小概率事件的
标准。在实际工作中常取 = 0.05。可根据
不同研究目的给予不同设置。
2020年8月10日
H0: 34.50 (该矿区新生儿的头围与当地一般新生儿头围均数相同) H1: 34.50 (该矿区新生儿的头围与当地一般新生儿头围均数不同) 0.05
2P012201年例88月-210日
由例7-5可知,2003年当地20岁应征 男青年身高总体均数的95%的可信区 间为170.1~172.3cm。该区间的下限 已高于1995年身高的总体均数 168.5cm,也说明2003年20岁应征男 青年增高了。
2020年8月10日
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
第八章
假设检验的基本概念
2020年8月10日
第一节
检验假设与P值
2020年8月10日
假设检验基本思想
假设检验过去称显著性检验。它是利 用小概率反证法思想,从问题的对立面 (H0)出发间接判断要解决的问题(H1)是否 成立。然后在H0成立的条件下计算检验 统计量,最后获得P值来判断。
2020年8月10日
2020年8月10日
本例:0 34.50cm, , X 33.89cm
造成 X 0 的可能原因有二:
① 抽样误差造成的; ② 本质差异造成的。
假 设 检 验 的 目 的 —— 就 是 判 断 差 别 是由哪种原因造成的。
2020
34.50cm
另一种假设H1
2020年8月10日
一 、 单 样 本 均 数 的 u 检 验 (one-sample
u-test)
适用于当n较大(如n>60)或
已知
0
时。检验统计量分别为
u X 0 X 0 (n较大时)
S X
Sn
u X 0 X 0
X
0 n
( 0已知时)
2P012201年例88月-210日
例8–2(续例7-5) 1995年,已知某 地20岁应征男青年的平均身高为 168.5cm。2003年,在当地20岁应征 男青年中随机抽取85人,平均身高为 171.2 cm,标准差为5.3cm,问2003 年当地20岁应征男青年的身高与1995 年相比是否不同?
若 P ,不拒绝H0,但不能下 “无差别”或“相等”的结论,只能下 “根据目前试验结果,尚不能认为有差 别”的结论。
2020年8月10日
第三节 大样本均数的假设检验
2020年8月10日
均数比较u检验的主要适用条件为:
1. 单样本数据,每组例数等于或大于60例;两样本数 据,两组例数的合计等于或大于60例,而且基本均等。 2.样本数据不要求一定服从正态分布总体。 3.两总体方差已知。 4.理论上要求:单样本是从总体中随机抽取,两样本 为随机分组资料。观察性资料要求组间具有可比性, 即比较组之间除了研究因素以外,其他可能有影响的 非研究因素均应相同或相近。
2020年8月10日
2. 计算检验统计量
根据变量和资料类型、设计方 案、统计推断的目的、是否满足特 定条件等(如数据的分布类型)选 择相应的检验统计量。
u (33.89-34.50) (1.99 / 55) 2.273
2020年8月10日
3. 确定P值,下结论
如例8–1已得到P<0.05, 按所取检 验水准0.05, 则拒绝H0,接受H1, 差异有统计学意义(统计结论), 可以认为矿区新生儿的头围均数与 一般新生儿不同,矿区新生儿的头 围小于一般新生儿(专业结论)。
2020年8月10日
1
P
t / 2,
t t /2,
2020年8月10日
若 P ,按所取检验水准 ,拒绝H0 , 接受H1 ,下“有差别”的结论。其统计学依 据是,在 H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H0 。
2020年8月10日
相关主题