当前位置:文档之家› 第五讲--假设检验问题(-35)PPT课件

第五讲--假设检验问题(-35)PPT课件


x 0
2.576 ( z0.005 )
n
13
假设检验的步骤
确定适应的原假设和备择假设; 选择检验统计量; 指定显著水平; 根据显著水平和统计量的抽样分布来确定统计
量的临界值,从而确定拒绝域; 根据样本计算统计量的值并与临界值比较看是
否落入拒绝域; 或计算p-值,并比较p-值与 得出结论。
布为N(
,
2
1)。(这是因为 n
25 251.)观来自到的x(= 17) 与A先
生宣称的 仅有1个标准误差 ,可被视作这一分布的一个典型观
察。因而,在A先生的说法与证据之间没有多少不一致。
14
15
16 17
18
假如另一位专家B先生宣称说 = 15,你会作何反应 呢?
根据B先生的说法,所观察到的 x (= 17)开始显得有点
2.67
n
36
z0.05 1.645
19
小样本下的解决方案
x
如果2未知,则 s
n
选择拒绝域为
~ t(n 1)
x
s
3
t 0 . 05 ( n
1)
n
20
一组虚拟的数据
我们设FTC抽取了20瓶Hilltop咖啡作为 随机样本,得到其质量分别为(磅):
2.82 3.01 3.11 2.71 2.93 2.68 3.02 3.01 2.93 2.56
拒绝域为
x 35
s z0.0251.96
现有一样本,n=100,
n
x 29 .44
s 20 .42
x 35 s
2.72 1.96
所以拒绝 H 0 .
n
或者:p P (| Y | 2.72 ) 0.006 0.05
其中 Y是标准正态随机变量。
16
是否对Hilltop咖啡投诉?
联邦贸易委员会(FTC)意欲对大瓶 Hilltop牌咖啡进行检查,以确定是否符 合其标签上注明的“容量至少是3磅”的 说法,并由此决定是否因为包装重量的 不足而对其提出投诉。
第五讲 假设检验问题
-
1
从一个例子看假设检验的思路
假设我们有意估计一个社区的平均收入。
假设收入总体是正态N(, 25),且抽取了
一个随机样本,其中有n = 25个观测值, 得到 x = 17。
现在,一位经济专家A先生宣称说,根据 他的知识,平均收入 = 16。你对此作 何反应?
2
我们可以按照以下方式推理。在观察 x = 17之前, x 的抽样分
H0: 3 H1:<3. 显著水平=0.05,
17
大样本下的解决方案
如果2已知,则拒绝域为
x
3
z 0 . 05
n
如果2未知,则拒绝域为
x
3
s
z 0 .05
n
18
假定由36听罐头所组成的一个样本的样
本均值为 x 2.92 磅,样本标准差
s=0.18
,你能拒绝原假设吗?
x3 s
2.92 3 0.18
概率。
一般的统计实践中: 假如p-值 <0.05, 则拒绝H0 , 并报告结
果在统计上是显著的(在0.05的水平)
如果p-值 0.05,则结果在统计上不显
著(在0.05的水平)
9
原假设= 15。由于观测到 x =17,观测到

z
=
17-15=2.
(这是因为
n
2
1
.) 因而,p-
值是概率
P (z 2 ) P (z 2 ) .0 4 5 5
所以拒绝原假设。
10
另一方面,对于本例而言,p-值<0.05等
价于
| Z | 1 .96 ,即
x 0
1 .96 ( z 0.025 )
n
因此上式称为拒绝域,意思是如果样本 均值的观测值如果落在这个区域里就要 拒绝原假设。
11
你会犯什么错误?
2.78 3.01 3.09 2.94 2.82 2.81 3.05 3.01 2.85 2.79
其样本均值为2.8965,样本标准为 0.148440135,
你可以拒绝原假设吗?
21
拒绝域为:
x3
s
t0.05(n1)
n
x3
s
0.1
2.89653 3.118
48440/ 12305
n
t0.05(201)1.729
你的 态度
接受 H0 拒绝 H0
H0 是真的
你是正确的
你犯的是 第一类错误
H1 是真的
你犯的是 第二类错误
你是正确的
12
第一类错误:当H0 为真时拒绝H0 第二类错误:当H0 为假时不拒绝H0 显著水平:犯第一类错误的最大概率。
前面的例子,犯第一类错误的最大概率为0.05。
如果希望犯第一类错误的最大概率为0.01, 则拒绝域变 为
极端,因为它现在偏离 有两个标准误差了。
13
14
15 16
17
假如第三位专家C先生宣称说 = 14又如何呢?
当然,假如 =14,那么观察到的 x(= 17)的确非常极 端,我们要么拒绝其说法,要么研究数据的准确性。
14
12
13
15
16
17
对值的假设(宣称)值与观测到的值之间的
差异大小的度量就是观察到更加极端的 x 的概 率(机率)。即:
14
方差未知时总体均值的双边检验
H 0 : 0; H1 : 0
拒绝域的形状应为
x 0 c( 0)
大样本时 因为 x 0 ~ N ( 0 ,1), 所以 s n
可以选择拒绝域为:
z x 0
s
n
2
15
一个例子
所有联合食品公司的顾客一次购买金额的平均值是35 美圆?
H0: =35. H1: 35 给定显著水平=0.05。
结论:拒绝原假设。
显著性水平 和拒绝域
H0: 3 H1: < 3
H0: 3 H1: > 3
H0: 3 H1: 3
当16:P(x15)P(x17)0.3173
15:P(x13)P(x17)0.0455
14:P(x1)1P(x17)0.0027
这一概率称作观察值 x 的p-值。
因而一个
较小的p-值意味着假设没有得到数据的支持 较大的p-值意味着假设与数据一致
假设检验的基本概念
H0: = 0 称为原假设 H1: 0称为备择假设 选择的态度:拒绝?不拒绝?
(To be or not to be,……) 更多的例子,简单假设和复合假设。
7
按照标准误差单位来度量偏离有多远。
首先,当 为已知时,这一距离由下式给出
z
x
0
n
这称作z统计量。按照原假设,即H0: = 0为真时,
在得到样本平均值之前,随机变量 z 的分布为单位正
态N(0,1)。使用p-值检验来衡量观测值z 与 0之间的差 异。这里的p-值是得到比观测值更为极端的z统计量的
相关主题