当前位置：文档之家› 假设检验的原理和方法

假设检验的原理和方法

四、两类错误
Ⅰ Ⅱ
0

错误
a虽然是一很小的概率值如0.01，但并不等于0，只是很小（a）而已。我们却完全否认这种可能性，认为它不可能发生，从而拒绝H0 。显然，这是一种错误，这种在拒绝H0 时犯下的错误，称为“I型错误”或“弃真错误” 或“a错误” 。
Ⅰ和Ⅱ重合时
0.95
0.025
U=-2.33 。
例2：某春小麦良种的
单尾检验
H0： 34 ；对 HA： > 34 = 0.05（单尾） x =35.2 g
S= 18.83 8-1 = 1.64 35.2 - 34
千粒重0＝34g，现自
外地引入一高产品种，在8个小区种植，得千粒重（g）35.6、37.6、 33.4、35.1、32.7、
错误
= 0
Ⅰ和Ⅱ不重合
错误
2

C2
C1
Ⅰ
Ⅱ
2
-u
0
u

从图可知，在a水平上，事件U<Ua，U 既位于H0分布之下，同时也位于HA的分布之下。由于u属于H0 的分布的概率很大，为1-a，所以我们接受H0 ，但是，U 同时也有大小为β的概率来自于HA 分布，这时我们却完全否认这种可能性，显然是一种错误。这种在接受H0 时犯下的错误，称为“Ⅱ型错误”或“β错误”或 “纳伪错误”（即无效假设H0是不正确的，我们却接受了它）。这种统计错误的性质是把真实差异错判为非真实差异。犯这种类型的错误概率不会超过β。
错误只在接受H0时发生
错误增加错误减小错误增加错误减小
结论 2、还依赖于 - 0 的距离
3、n , 2 可使两类错误的概率都减小.
单尾检验：否定区只在一侧
0.95
0.05
0.05
0.95
接受区 1.64 否定区
-1.64 接受区左尾检验
右尾检验
假设检验的步骤:
2 、确定显著水平
能否定H0的人为规定的概率标准称为显著水平，记作。统计学中，一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。
＝0.05 ＝0.01
P<
显著水平* 极显著水平**
3 、选定检验方法，计算检验统计量，确定概率值根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例：
第四章
第一节第二节第三节第四节第五节
假设检验的原理与方法样本平均数的假设检验样本频率的假设检验
参数的区间估计与点估计
方差的同质性检验
一概念：
假设检验（hypothesis test）又称显著性检验（significance test）,就是根据总体的理论分布和小概率原理，对未知或不完全知道的总体提出两种彼此对立的假设，然后由样本的实际原理，经过一定的计算，作出在一定概率意义上应该接受的那种假设的推断。
=0.05/0.01
• 实例
例：某地区的当地小麦品种一般亩产300kg，标准差75kg。现有新品种通过25个小区的试验，获得其平均产量为330kg/亩，新品种与当地品种是否有显著差异？
提出假设我认为小麦平均产量是 300kg
作出决策
接受或拒绝假设
抽取随机样本
均值x=330kg
x 0 126
x x = u= u= x
x
2 x
240 40 n 6
2
136-126 √40
= 1.581
P( u >1.581)=2×0.0571=0.1142
4、作出推断结论：是否接受假设
小概率原理
P>
可能正确
接受H0 否定HA 否定H0 接受HA
• 思考： P81 习题4.1，4.2，4.3
P(-2.58x <x< +2.58x) =0.99
左尾
0.005 -2.58x 否定区
0.99 0 接受区
0.005 +2.58x 否定区
右尾
临界值： + 2.58x
双尾检验
(two-sided test)
（二）单尾测验
假设检验时所考虑的概率仅为分布曲线左边或右边一尾概率之时，称单尾检验。单尾检验一般用于安全检查，如生产安全、食品安全和卫生防御等。
治疗前 0 ＝126 2 ＝240 治疗后 n ＝6 x ＝136
N ( 126，240 ）
未知
那么＝0 ? 即克矽平对治疗矽肺是否有效？
1 、提出假设
无效假设 /零假设 /检验假设
H0 误差效应
0 ＝
对立
备择假设 /对应假设
0 HA
处理效应
例：克矽平治疗矽肺病是否能提高血红蛋白含量？
• 实例
例：某地区的当地小麦品种一般亩产 300kg，标准差 75kg。现有新品种通过25个小区的试验，获得其平均产量为330kg/亩，新品种与当地品种是否有显著差异？
提出假设计算假设正确的概率
=0.05
统计决策
• 实例
抽样分布
这个值是我们应该得到的样本均值？
H0 1.96 x
第四章
统计推断
(statistical inference)
第四章统计推断
由一个样本或一糸列样本所得的结果来推断总体的特征
统计推断
假设检验
参数估计
统计推断的过程
Ⅳ
总体
总体均值、方差
Ⅲ
Ⅴ
样本统计量例如：样本均值、方差
样本
Ⅰ
Ⅱ
任务
分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断
右尾检验
２
２
双尾检验分位数
u 0.05=1.96 u 0.01=2.58
＞
否定区
接受区
否定区
接受区
否定区
单尾检验分位数
u 0.05=1.64 u 0.01=2.33
查表时，单尾概率等于双尾概率乘以2
同一显著水平下，双尾检验的临界值大于单尾检验的临界值。如α＝0.05时，双尾 |U|=1.96，而单尾为U=1.64或U=-1.64 ；α＝ 0.01时，双尾|U|=2.58,而单尾为U=2.33或
一般认为，两尾测验较为稳妥，对结果考虑的思路较宽，故很常用。
P(-1.96x <x< +1.96x) =0.95
双尾检验
(two-sided test)
左尾
0.025
-1.96x 否定区
0.95 0 接受区
0.025
+1.96x 否定区
右尾
临界值： + ux
+ 1.96x
SS = 18.83
Sx = 1.64 8 = 0.58
36.8、35.9、34.6，问
新引入品种的千粒重是否显著高于当地良
t=
0.58
= 2.069
种？
df = 7 时
t 0.05= 1.895
|t | > t0.05，P < 0.05
否定 H0： 34 g，即新引进品种的千粒重显著比当地良种千粒重高。
x-0＝136-126＝10(mg/L)这一差数是由于治疗造成的，还是抽样误差所致。平均数的假设检验
检验治疗后的总体平均数是否还是治疗前的126(mg/L)？
H0:μ=μ0 =126(mg/L)
HA:μ ≠μ
0
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样，二者来自同一总体，接受零假设则表示克矽平没有疗效。而相对立的备择假设表示拒绝H0，治疗后的血红蛋白平均数和治疗前的平均数来自不同总体，即克矽平有疗效。
假设检验的两类错误
H0正确
否定H0 错误()
H0 错误
推断正确(1-)
接受H0
推断正确(1-)
错误()
第一类错误（type I error），又称弃真错误或错误;
第二类错误（ type II error ），又称纳伪错误或错误
结论
１、两类错误既有联系又有区别
错误只在否定H0时发生
“勉强可吃、可用的就是不能吃、不能用”。
抽样分布
拒绝区H0
0.05
H0 x
1.895
单尾检验假设：
(one-sided test)
H0 ： ≤0 HA ： > 0
H0 ： ≥0 HA ： < 0
0.95
0.05
0.05
0.95
接受区 1.64
否定区
-1.64 接受区左尾检验
差异达显著水平
u >2.58
P( u ) <0.01
差异达极显著水平
三、双尾检验与单尾检验
• 无论什么样的情况，假设检验时，首先要作出无效假设H0，且作出这个假设是要有依据的。
通常假设被比较的对象间没有差异，或现在的状
况与已知的或原来的状况相符合。 • 经测验，当H0被拒绝时，所接受的假设是与H0相对立的备择假设HA。HA有如下三种情况可供选择： HA： 0 ； HA ： 0 0 ；即 HA ：
…如果这是总体的真实均值
μ= 300
330 ?
样本均值
我们拒绝还是接受假设μ＝300 ？
三、假设检验的步骤例：设矽肺病患者的血红蛋白含量具平均数0＝126(mg/L)，
2 ＝240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进行治疗，治疗后化验测得其平均血红蛋白含量x =136(mg/L)。

e商务文档

假设检验的原理和方法

相关文档推荐：