第七章假设检验
k
,
n
也就是说,事件“|
U
|
z
”2
2
2
是一个小概率事件.
由标准正态分布的上分位点的定义知:
k z 2 ,
17
故可以取拒绝域为 W: | U | z 2
如果由样本值算得该统计量的实测值落
入区域W,则拒绝H0 ;否则,不能拒绝H0 .
这是因为,如果H0 是对的,那么衡量差 异大小的某个统计量落入区域 W(拒绝域) 是 个小概率事件. 如果该统计量的实测值落入 W,也就是说, H0 成立下的小概率事件发生 了, 那么就认为H0不可信而否定它. 否则就不 能否定H0 (只好接受它).
n
体N (, 2 )的样本. 且设是已知常数.
12
现在要检验的假设是:
H0 : 0 (0 355),
它的对立假设是:
H1 : 0,
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设); 称H1为备选假设(或对立假设). 那么,如何判断原假设H0 是否成立呢?
13
H0 : 新技术未提高效益,H1 : 新技术提高效益.
30
•假设检验 —基本概念
原 把需要检验的
假 假设称为原假
关于总体
假 设
分布的某 个命题
设 设,记为H0.
备 在拒绝原假设后,可供 择 选择的一个命题称为
假 备择假设,它是原假设
设 的对立假设,记为H1.
31
•假设检验 —基本概念
检验统计量 用于判断原假设成立与否的统计量
P{第二类错误}= P{接受H0|H0不真}= .
26
•假设检验的两类错误
显著性水平 为犯第一类错误的概率.
两类错误是互相关联的, 当样本容量 固定时,一类错误概率的减少导致另一类 错误概率的增加.
要同时降低两类错误的概率, ,或 者要在 不变的条件下降低 ,需要增加
样本容量.
27
•关于假设
| t |=2.997<4.0322
没有落入
故不能拒绝H0 .
拒绝域
这并不意味着H0一定对,只是差异
还不够显著, 不足以否定H0 .
23
•假设检验的两类错误
假设检验会不会犯错误呢? 由于作出结论的依据是 不是一定不发生
小概率原理 小概率事件在一次试验中基本上不会发生
24
•假设检验的两类错误
如果H0成立,但统计量的实测值落入 否定域,从而作出否定H0的结论,那就犯 了“弃真”的错误 .
U 检验 t 检验
2 检验
用正态分布
用 t 分布 用 2 分布
F 检验 用 F分布
按照对立假设的提法,分为 双侧检验 它的拒绝域取在两侧
单侧检验 它的拒绝域取在左侧或右侧
37
例2
某织物强力指标X的均值0=21公斤. 改
进工艺后生产一批织物,今从中取30件,测 得 X=21.55公斤. 假设强力指标服从正态分
n
且 x x 0 应该较小.
而衡量
x
0
的大小,可归结为衡量
x
0
n
的大小.
15
选择适当的正数k, 使样本的观察值x满足
x 0 n
k时,就拒绝原假设H
;
0
反之,若样本的观察值 x满足
x 0 n
k时,就接受原假设H0 .
怎样求数 k 呢?
16
给定一个很小的数:0 1, 使得
P
X
度是32.5毫米. 实际生产的产品,其长度X
假定服从正态分布N , 2 , 2未知,现从
该厂生产的一批产品中抽取6件, 得尺寸数 据如下:
32.56, 29.66, 31.64 30.00, 31.87, 31.03
问这批产品是否合格?
…
20
分析:这批产品(螺钉长度)的全体组成问题的 总体X. 现在要检验E(X)是否为32.5.
代入 =1.2, n=30,
并由样本值计算得统计
{U u0.01}是
一小概率事件
量U的实测值
布N(, 2), 且已知 =1.2公斤, 问在显著性 水平 =0.01下,新生产织物比过去的织物
强力是否有提高?
解 提出假设:
H0 : 21, H1 : 21.
38
取统计量 U X 21 ~ N (0,1)
n
确定k,使得
P
X
21 n
k
,
k z
o k z x
39
拒绝域为 W : U u0.01 =2.33
假设其中真有99个白球, 摸出红球的概率只有1/100, 这是小概率事件. 小概率事件在一次试验中竟然发生了,不 能不使人怀疑所作的假设. 这个例子中所使用的推理方法,可以称为 带概率性质的反证法 不妨称为概率反证法.
7
小概率事件原理
小概率事件在一次试验中基本上不会发生
它不同于一般的反证法 一般的反证法要求在原假设成立的条件 下导出的结论是绝对成立的,如果事实与之 矛盾,则完全绝对地否定原假设. 概率反证法的逻辑是:如果小概率事件 在一次试验中居然发生,我们就以很大的把 握否定原假设.
称为检验统计量. 显著水平
控制 P (拒绝H0 | H0为真 ) 中的 称为检验的显著水平.
32
•假设检验 —基本概念
拒绝域 使原假设H0被拒绝的样本观测值所
组成的区域称为检验的拒绝域. 接受域
保留原假设H0的样本观测值所组成 的区域称为检验的接受域.
33
•假设检验 —基本概念
显著性检验 只对犯第一类错误的概率加以控制,
18
不否定H0并不是肯定H0一定对,而只 是说差异还不够显著,还没有达到足以否 定H0的程度 . 所以假设检验又叫 “显著性检验”
如果显著性水平取得很小,则拒绝
域也会比较小. 其产生的后果是: H0难于
被拒绝. 如果在α很小的情况下H0仍被拒
绝了,则说明实际情况很可能与之有显著 差异.
19
例1
某工厂生产的一种螺钉,标准要求长
4
小概率事件原理
小概率事件在一次试验中基本上不会发生
现从两盒中随机取出一个盒子,问这个 盒子里是白球99个还是红球99个?
5
小概率事件原理
小概率事件在一次试验中基本上不会发生
不妨假设:这个盒子里有99个白球. 现在从中随机摸出一个球,发现是 此时如何判断这个假设是否成立呢?
6
小概率事件原理
小概率事件在一次试验中基本上不会发生
而不考虑犯第二类错误的概率的检验.
双边假设检验
显著性检验 单边假设检验
34
提出 假设
总 结
抽取 样本
P(T W)=
-----犯第一
类错误的概率, W为拒绝域
根据统计调查的目的, 提出 原假设H0 和备选假设H1
检验 假设
显著性 水平
作出 决策
拒绝还是不 能拒绝H0
对差异进行定量的分析, 确定其性质(是随机误差
t 2(5) t0.005(5) 4.0322,
使
P{| t | t 2(5)} 2
2
即“ | t | t 2(5)”
是一个小概率事件 .
x
o k t 2 n 1
小概率事件在
得拒绝域 W: |t |>4.0322 一次试验中基
本上不会发生
22
拒绝域 W: |t |>4.0322
第四步 将样本值代入算出统计量 t 的 实测值,
代入 =1.2, n=30,
并由样本值计算得统计
{U u0.01}是
一小概率事件
量U的实测值
U=2.51>2.33
落入拒绝域
故拒绝原假设H0 .
这认时为可新能生犯产第织一物类比错过误去,的犯织错物误强的力概 率是不有超所过提0高.01..
40
作业
P178 2
41
正态总体均值的假设检验
X1, X2,L , Xn : N , 2 ,
由于是正态分布的期望值,它的估计量是
样本均值X,因此可以根据X与0的差距
X 0 来判断H0 是否成立.
当
X
0
较小时,可以认为H
是成立的;
0
当
X
0
较大时,应该认为H
不成立的,
0
即生产已不正常.
较大、较小是一个相对的概念,合理的
界限在何处?应由什么原则来确定?
14
问题是:如何给出这个量的界限?
在原假设为真时, U @X 0 : N 0,1 ,
如果H0不成立,但统计量的实测值未 落入否定域,从而没有作出否定H0的结论, 即接受了错误的H0,那就犯了“取伪”的 错误 .
25
•假设检验的两类错误
假设检验的两类错误
实际情况
决定
拒绝H0 接受H0
H0为真 第一类错误
正确
H0不真 正确
第二类错误
犯两类错误的概率
P{第一类错误}= P{拒绝H0|H0为真}= ,
假设检验 非参数假设检验 总体分布未知时的
假设检验问题
2
第七章 假设检验
❖假设检验 ❖一个正态总体均值与方差的假设检验 ❖两个正态总体均值或方差的比较 ❖置信区间与假设检验
3
小概率事件原理
小概率事件在一次试验中基本上不会发生 设有两个盒子,各装有100个球.
…99个
99个红白球 一个白红球
另一一盒盒中中的的白白球球和和红红球球数数
种错误. (1)将假药误作真药,则冒着伤害病人的健 康甚至生命的风险. (2)将真药误作假药,则冒着造成经济损失 的风险.
显然,犯错误(1)比犯错误(2)的后果 很严重. 所以选取