第二章 参数估计与假设检验
实际情况
H0 真 1- H0 假 Type II Error ( ) Power (1 - )
Type I Error ( )
Relationship Between a & a & 间的联系
两个错误有反向的关 系
两类错误的关系
H0:μ=μ0 H1:μ=μ1
β
0
t(n-1)
与前面分析完全类似地,可得如下检验方法:
统计量
p P0 Z P0 (1 P0 ) / n
H1
P≠P0 P > P0 P < P0
拒绝域
| Z | Z / 2 Z Z
Z Z
24
【案例5】某一系列电视剧是否获得成功
如果能够证明某一系列电视剧在播出的头13周其观众的 收视率超过了25%,则可以断定它获得了成功。假定由 400个家庭组成的样本中,有112个家庭在头13周看过了 某系列电视剧。在 = 0.01 的显著性水平下,检验这部。 系列电视剧是否获得了成功。 解:由题意,H0:P = P0 = 25%,H1:P > 25%, 样本比例 p = 112/400 = 0.28
10
1.提出一个希望推翻的假设, 称为原假设, 记为 H0
本例中
H0: = 0
2. 按希望出现的结果提出一个与原假设对立的假设, 称为备择假设,记为 H1。 本例中 H1: > 0 3. 构造一个能用来检验原假设 H0 的统计量 本例中,要检验的是总体均值 ,而 X 是 的优良 估计, 故应使用 X 来构造检验 的统计量。 当 H0 为真时,统计量 X 0 t ~t (n-1) 11
20
案例 1 解答:
设新钢丝的平均抗拉强度为 , 2 未知,故使用 t 检验。由题意,本案例为右边检验问题, H0: =0, H1: >0
.4, S = 81, 由所给样本数据, 可求得:x 10631 n =10, =0.05, t0.05(9)=1.8331
10631 .4 10560 t 2.7875 S/ n 81/ 10
23
§5.4大样本单个总体比例的检验
设总体成数为 P, 则当 nP 和 n (1-P) 都大于5时, 样本成数 p 近似服从均值为 P, 方差为 P (1-P)/n 的正态 分布。 从而当原假设 H0:P = P0 为真时, 统计量 p P0 Z ~ N (0, 1) P0 (1 P0 ) / n
P{ t≤t(n-1)|H0 不真}=
由于 H0 不真时与 H0 为真时,统计量 t 的分布是 14 不同的, 故 β≠1-。
Result Possibilities 结果的各种可能性
H0: 无辜 法官判决 实际情况 判决 无辜 有罪 无辜 Correct Error 有罪 Error Correct 决策 没有拒绝 H0 拒绝 H0 假设检验
第5章 假设检验
本章教学目标
了解和掌握统计推断中的另一个基本问题:参 假设检验及其在经济管理中的应用; 掌握运用 Excel 的“数据分析”及其统计函数 功能求解假设检验问题。
1
本章主要内容
§5.1 案例介绍 §5.2 假设检验的基本原理 §5.3 单个正态总体均值的检验 §5.4 单个正态总体方差的检验 §5.5 两个独立正态总体均值的检验 §5.6 成对样本试验的均值检验 §5.7 两个正态总体方差的检验 §5.5 总体比例的检验 本章重点:假设检验中不可避免的两类错误及其应用 Excel―数据分析”功能的使用及其运行输出结果分析。 难点:假设检验中不可避免的两类错误及其应用。
8
§5.2 假设检验的原理
一、实际推断原理 假设检验的理论是小概率原理,又称为实际推断 原理,其具体内容是:小概率事件在一次试验中是 几乎不可能发生的。 二、假设检验推理的思想方法 假设检验推理的思想方法是某种带有概率性质的 反证法。
9
. §5.2 假设检验的原理
三、基本原理和步骤 例1:统计资料表明,某电子元件的寿命 X~N(0 , 2 ), 其中 0 已知, 2 未知。 现采用了新工艺生产,测得新工艺生产的 n 个元件寿命 为 x1 , x2 , · · · , xn。 问: 新工艺生产的元件期望寿命 是否比原工艺的元件期望寿 命 0 有显著提高? 此问题要推断的是: 是否 > 0? 这可用假设检验的方法解决,步骤如下:
5
【案例4】哪种安眠药的疗效好?
为分析甲、乙两种安眠药的效果,某医院将20个失 眠病人分成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时)
病人 安眠药
1 1.9
2 0.8
3 1.1
4
5
6
7
8
9
10
甲 乙
0.1 –0.1 4.4 5.5 1.6 4.6 3.4
19
案例1. 检验新工艺的效果
某厂生产的一种钢丝抗拉强度服从均值为 10560(kg/cm2)的正态分布,现采用新工艺生 产了一种新钢丝,随机抽取10根测得抗拉强 度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670 问在显著性水平 = 0.05下,新钢丝的平 均抗拉强度比原钢丝是否有显著提高?
/2
- t/2(n-1) 0
1-
/2
x
18
t/2(n-1)
Байду номын сангаас 2. H1: > 0 (右边检验)
当 H0 为真时,由 P { t ≤ t ( n-1) }=1- 可得:若 t > t ( n-1 ) 就拒绝 H0,接受 H1; 否则就认为 并不显著高于 0 。
f ( x) 3. H1: < 0 (左边检验) 1- 由 P { t ≥ -t (n-1) }=1- 可得:若 t < -t ( n-1 ) x -t(n-1) 就拒绝 H0,接受 H1; 左边检验的拒绝域 否则就认为 并不显著小于 0 。
7
【案例6】女企业家对成功的理解是否不同
对女企业家进行了一项研究来看她们对成功的 理解。给她们提供了几个备选答案,如快乐 / 自我 实现,销售/利润,成就/挑战。根据她们业务的总 销售额将其分为几组。销售额在 10 万 ~50 万元的在 一组,少于10万元的在另一组。 要研究的问题是:把销售 / 利润作为成功定义的 比率,前一组是否高于后一组?
0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
(1)哪种安眠药的疗效好? (2)如果将试验方法改为对同一组10个病人,每人分 别服用甲、乙两种安眠药作对比试验,试验结果仍如上 表,此时结论如何?
6
【案例5】某一系列电视剧是否获得成功
如果能够证明某一系列电视剧在播出的头 13周其观众的收视率超过了25%,则可以 断定它获得了成功。假定由400个家庭组成 的样本中,有112个家庭在头13周看过了某 系列电视剧。现在要判断这部电视剧是否 获得了成功。
S/ n
4. 给定一个小概率 ,
称为显著性水平
显著性水平 是当 H0 为真时, 拒绝 H0 的概率 (即犯“弃真”错误的概率)。也即当检验结果拒绝 H0 时, 不犯错误的概率为 1-, 从而可以有1- 的可信度接受 备择假设 H1。 5. 确定要拒绝 H0 时统计量的取值范围, 称为拒绝域,
2
§5.1 案例介绍 【案例1】新工艺是否有效?
某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。 现采用新工艺生产了一种新钢丝,随机抽取 10 根, 测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670 求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。 是否就可以作出新钢丝的平均抗拉强度高于原钢 丝,即新工艺有效的结论?
x
由图可知,减少 会增大 ,反之也然。 在样本容量 n 不变时,不可能同时减小犯两类错误的概率。 应着重控制犯哪类错误的概率,这应由问题的实际背景决 定。 当第一类错误造成的损失大时,就应控制犯第一类错误的 概率 (通常取 0.05,0.01等); 反之,当第二类错误造成的损失大时,就应控制犯第二类 错误的概率 。 17 要同时减小须犯两类错误的概率,必须增大样本容量 n。
f ( x)
间存在显著差异。 这就是称 为显著性水平的原因。
0 t (n-1) x
13
右边检验的拒绝域
二.检验中可能犯的两类错误
设 t 为检验原假设 H0 所用的统计量,t(n-1)为检 验的临界值,由显著性水平 的定义(右边检验)
P{ t >t(n-1) | H0 为真}=
可知检验中可能出现以下两类判断错误: 第一类错误 ——当 H0 为真时拒绝 H0 的错误, 即“弃真”错误,犯此类错误的概率为 。 第二类错误 ——当 H0 不真时接受 H0 的错误, 即“取伪”错误, 记犯该类错误的概率为 ,即
§5.3 单个总体均值的检验 · · , Xn 为总体 设 X~N( , 2 ), 2 未知,X1, X2, · X 的样本,给定水平 ,原假设为 H0: =0 ( 0为某一给定值) 当 H0 为真时,统计量
X 0 t ~t (n -1) S/ n
1. H1:≠0 (双边检验) 当 H0 为真时, 由 P{-t/2 (n-1)≤t≤t/2 (n-1)}=1- f ( x) 可得: 若 |t|> t/2 (n-1) 就拒绝 H0,接受 H1; 否则接受 H0。
课堂练习 3
一台自动包装奶粉的包装机,其额定标准为每 袋净重 0.5 kg。某天开工时,随机抽取了 10 袋产 品,称得其净重为: 0.497,0.506,0.509,0.508,0.497 0.510,0.506,0.495,0.502,0.507 (1)在水平 = 0.20下,检验该天包装机的重量设 定是否正确?( x 0.5037 ,S= 0.00554 ) (2)在本题的检验问题中,为什么要将 取得较 大?