假设检验的原理和方法
四、两类错误
Ⅰ Ⅱ
0
错 误
a虽然是一很小的概率值如0.01,但并不等于0, 只是很小(a)而已。我们却完全否认这种可能性, 认为它不可能发生,从而拒绝H0 。显然,这是一 种错误,这种在拒绝H0 时犯下的错误,称为“I型 错误”或“弃真错误” 或“a错误” 。
Ⅰ和Ⅱ重合时
0.95
0.025
U=-2.33 。
例2:某春小麦良种的
单尾检验
H0: 34 ;对 HA: > 34 = 0.05(单尾) x =35.2 g
S= 18.83 8-1 = 1.64 35.2 - 34
千粒重0=34g,现自
外地引入一高产品种, 在8个小区种植,得千 粒重(g)35.6、37.6、 33.4、35.1、32.7、
错误
= 0
Ⅰ和Ⅱ不重合
错 误
2
C2
C1
Ⅰ
Ⅱ
2
-u
0
u
从图可知,在a水平上,事件U<Ua,U 既位于H0分布之下,同时也位于HA的分布 之下。由于u属于H0 的分布的概率很大,为1-a,所以我们接受H0 ,但是,U 同 时也有大小为β的概率来自于HA 分布,这时我们却完全否认这种可能性,显然 是一种错误。这种在接受H0 时犯下的错误,称为“Ⅱ型错误”或“β错误”或 “纳伪错误”(即无效假设H0是不正确的,我们却接受了它)。这种统计错误的 性质是把真实差异错判为非真实差异。犯这种类型的错误概率不会超过β。
错误只在接受H0时发生
错误增加 错误减小 错误增加 错误减小
结论 2、 还依赖于 - 0 的距离
3、n , 2 可使两类错误的概率都减小.
单尾检验: 否定区只在一侧
0.95
0.05
0.05
0.95
接受区 1.64 否定区
-1.64 接受区 左尾检验
右尾检验
假设检验的步骤:
2 、 确定显著水平
能否定H0的人为规定的概率标准称为显著水平,记作。 统计学中,一般认为概率小于0.05或0.01的事件为 小概率事件,所以在小概率原理基础上建立的假设检验 也常取=0.05和=0.01两个显著水平 。
=0.05 =0.01
P<
显著水平* 极显著水平**
3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选 择使用不同的检验方法。 例:
第四章
第一节 第二节 第三节 第四节 第五节
假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验
参数的区间估计与点估计
方差的同质性检验
一 概念 :
假设检验(hypothesis test)又称显著 性检验(significance test),就是根据总体 的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设, 然后由样本的实际原理,经过一定的计算, 作出在一定概率意义上应该接受的那种假 设的推断。
=0.05/0.01
• 实例
例:某地区的当地小麦品种一般亩 产300kg,标准差75kg。现有新品 种通过25个小区的试验,获得其平 均产量为330kg/亩,新品种与当地 品种是否有显著差异?
提出假设 我认为小麦 平均产量是 300kg
作出决策
接受或拒绝 假设
抽取随机样本
均值x=330kg
x 0 126
x x = u= u= x
x
2 x
240 40 n 6
2
136-126 √40
= 1.581
P( u >1.581)=2×0.0571=0.1142
4、作出推断结论:是否接受假设
小 概 率 原 理
P>
可能正确
接受H0 否定HA 否定H0 接受HA
• 思考: P81 习题4.1,4.2,4.3
P(-2.58x <x< +2.58x) =0.99
左尾
0.005 -2.58x 否定区
0.99 0 接受区
0.005 +2.58x 否定区
右尾
临界值: + 2.58x
双尾检验
(two-sided test)
(二)单尾测验
假设检验时所考虑的概率仅为分布曲线左边或右边一尾概率 之时,称单尾检验。 单尾检验一般用于安全检查,如生产安全、食品安全和卫生 防御等。
治疗前 0 =126 2 =240 治疗后 n =6 x =136
N ( 126,240 )
未知
那么 =0 ? 即克矽平对治疗矽肺是否有效?
1 、提出假设
无效假设 /零假设 /检验假设
H0 误差 效应
0 =
对 立
备择假设 /对应假设
0 HA
处理 效应
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
• 实例
例:某地区的当地 小麦品种一般亩产 300kg,标准差 75kg。现有新品种 通过25个小区的试 验,获得其平均产 量为330kg/亩,新 品种与当地品种是 否有显著差异?
提出假设 计算假设正 确的概率
=0.05
统计决策
• 实例
抽样分布
这个值是我们应该得 到的样本均值?
H0 1.96 x
第四章
统计推断
(statistical inference)
第四章 统计推断
由一个样 本或一糸 列样本所 得的结果 来推断总 体的特征
统 计 推 断
假设检验
参数估计
统计推断的过程
Ⅳ
总体
总体均值、 方差
Ⅲ
Ⅴ
样本统计量 例如:样本均值、 方差
样本
Ⅰ
Ⅱ
任务
分析误差产生的原因 确定差异的性质 排除误差干扰 对总体特征做出正确判断
右尾检验
2
2
双尾 检验 分位数
u 0.05=1.96 u 0.01=2.58
>
否定区
接受区
否定区
接受区
否定区
单尾 检验 分位数
u 0.05=1.64 u 0.01=2.33
查表时,单尾概率等于双尾概率乘以2
同一显著水平下,双尾检验的临界值大于单 尾检验的临界值。如α=0.05时,双尾 |U|=1.96,而单尾为U=1.64或U=-1.64 ;α= 0.01时,双尾|U|=2.58,而单尾为U=2.33或
一般认为,两尾测验较为稳妥,对结果考虑的思路 较宽,故很常用。
P(-1.96x <x< +1.96x) =0.95
双尾检验
(two-sided test)
左尾
0.025
-1.96x 否定区
0.95 0 接受区
0.025
+1.96x 否定区
右尾
临界值: + ux
+ 1.96x
SS = 18.83
Sx = 1.64 8 = 0.58
36.8、35.9、34.6,问
新引入品种的千粒重 是否显著高于当地良
t=
0.58
= 2.069
种?
df = 7 时
t 0.05= 1.895
|t | > t0.05,P < 0.05
否定 H0: 34 g,即新引进品种的千粒重显著比当地良种千粒重高。
x-0=136-126=10(mg/L)这一差数 是由于治疗造成的,还是抽样误差所致。 平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
H0:μ=μ0 =126(mg/L)
HA:μ ≠μ
0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样, 二者来自同一总体,接受零假设则表示克矽平没有疗效。 而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数 和治疗前的平均数来自不同总体,即克矽平有疗效。
假设检验的两类错误
H0正确
否定H0 错误()
H0 错误
推断正确(1-)
接受H0
推断正确(1-)
错误()
第一类错误(type I error),又称弃真错误或 错误;
第二类错误( type II error ) ,又称纳伪错误或 错误
结论
1、 两类错误既有联系又有区别
错误只在否定H0时发生
“勉强可吃、可用的就是不能吃、不能用”。
抽样分布
拒绝区H0
0.05
H0 x
1.895
单尾检验 假设:
(one-sided test)
H0 : ≤0 HA : > 0
H0 : ≥0 HA : < 0
0.95
0.05
0.05
0.95
接受区 1.64
否定区
-1.64 接受区 左尾检验
差异达显著水平
u >2.58
P( u ) <0.01
差异达极显著水平
三 、双尾检验与单尾检验
• 无论什么样的情况,假设检验时,首先要作出无效假 设H0,且作出这个假设是要有依据的。
通常假设被比较的对象间没有差异,或现在的状
况与已知的或原来的状况相符合。 • 经测验,当H0被拒绝时,所接受的假设是与H0相对立 的备择假设HA。HA有如下三种情况可供选择: HA: 0 ; HA : 0 0 ;即 HA :
…如果这是总 体的真实均值
μ= 300
330 ?
样本均值
我们拒绝还是接受假设μ=300 ?
三、假设检验的步骤 例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。