当前位置:文档之家› 第八章 假设检验与方差分析

第八章 假设检验与方差分析

第Ⅰ类错误/弃真错误 (type Ⅰ error) 类错误/
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率 通常记为 α 。
第Ⅱ类错误/取伪错误(type Ⅱ error) 类错误/取伪错误(type
当原假设为假时没有拒绝原假设。犯第Ⅱ类错误的 概率通常记为 β 。 在统计实践中,进行假设检验时一般先控制第Ⅰ类 错误发生的概率,并确定犯第Ⅰ类错误的概率最大值, 称为检验的显著性水平 显著性水平。显著性水平一般选择为0.05和 显著性水平 0.01。
3.对决策情况下的检验 3.对决策情况下的检验
在决策情况下的检验研究中,决策者必须从两种措 施中挑选其中一种,无论是接受还是拒绝,都必须采 取一定的措施。
假设检验的三种形式
设 µ0 表示在原假设和备择假设中考虑的某 一特定数值,µ 表示总体的实际值。对总体 的假设检验一定要采取下面的三种形式之一 :
2
检验统计量的值为
Ζ= X − µ0
2
σX
240.00 − 260.00 = = −2.79 43.00 36
因为 Ζ = −2.79 p −1.96 ,落在拒绝域内,所以否定原 假设,也就是说有95%的可靠程度否定原假设。如果将 样本均值与图8-1中均值的临界值比较,将得到相同的 结论。
图8-2 双边检验的拒绝域与接受域
样本均值的临界值 = µ 0 ± Ζ α σ X = 260.00 ± 1.96 × 43.00 36 2 = 260.00 ± 14.05 = 245.95 ~ 274.05
因此,为了拒绝原假设,这个样本均值的值必须 比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
二、方差分析
在方差分析中,我们将那些影响实验指标的 条件称为因素 因素,而将因素所处的条件称为水 因素 水 平。 如果所研究的问题只涉及一个影响因素,则 称这样的方差分析为单因素分析 单因素分析; 单因素分析 如果所研究的问题涉及多个影响因素,则称 为多因素分析 多因素分析。 多因素分析 单因素方差分析只检验一个变量的影响,是 单因素方差分析只检验一个变量的影响 最简单的形式的方差分析。它可以检验两个 或两个以上的样本均值之间的差异。
㈡ 方差分析的基本假设
⑴ 每个总体都应服从正态分布 每个总体都应服从正态分布。也就是说, 对于因素的每一个水平,其观察值是来自服 从正态分布总体的简单随机样本。 ⑵ 各个总体的方差必须相同。也就是说,各 各个总体的方差必须相同。 组观察数据是从具有相同方差的总体中抽取 的。 ⑶ 观察值之间是相互独立的 观察值之间是相互独立的。
第 八 章 假设检验与方差分析
本章学习目的
理解原假设、备择假设、两类错误、单侧检验、双侧 理解 检验、方差分析等概念。 掌握三种不同的实际情况下——陈述正确性、研究性、 掌握 决策——建立假设检验的方法。 掌握总体方差已知或未知时正态总体的均值假设检验 掌握 和总体比例的假设检验。
本章重难点提示
重点是三种不同情况下的假设检验方法,总体方差已 重点 知时正态总体均值和总体比例的假设检验。 难点是总体方差未知时正态总体均值的假设检验和方 难点 差分析。
X − µ0 X − µ0 t= = s sX n
[例8-4] 某品牌笔记本电脑的说明书声称电池平均充电
次数可达4 200次。为验证其真实性,现随机抽取样本调 查,结果显示平均充电次数是4200次,样本标准差为200 小时。若一般电脑的电池充电次数服从正态分布,在5% 的显著性水平下,检验说明书是否属实?
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X = 240.00 ,当显著性水平为0.05时,原假设是否被拒 绝。 当 α = 0.05 时,对应于的双侧检验的临界值
− Ζ α = − Ζ 0.025 = − 1.96 Ζ α = Ζ 0.025 = 1.96
P (1 − P ) n
在显著性水平 α = 0.05 情况下,查表可知,
Ζ
0 .0 5
= 1 .6 4 5
因为 Ζ f 1.645 ,拒绝原假设 H 0 。所以,该 保龄球馆的经理可以得出结论:女性保龄球手 的比例有所提高。
第二节 方差分析
一、方差分析的基本问题 ㈠ 概念
方差分析是检验几个总体均值之间是否存在差别 时最常用的统计方法,其基本原理是英国统计学家 罗纳德A·费希尔(Ronald A· Fisher)在进行实验 设计时为了解释试验数据而首先引入的。方差分析 的原假设是多个总体均值彼此相等,抽样方法是独 立地从每个分类范畴(即处理水平)中取样。
0
㈠ 总体方差已知时正态总体均值的假设检验
σ 2 已知,用正态分布来检验总 当总体方差 体均值的假设值的情况如下: ⑴ 当样本数 n ≥ 30 (大样本)时的任 意分布总体,(根据中心极限定理); ⑵ 当样本数 n p 30 (小样本)但是总 体是正态分布的。
示例
[例8-1] 某公司称其应收账金额的均值为RMB260.00,审
假设: 假设 H 0 : µ ≥ 4 200 ; H1 : µ p 4 200 右单侧检验 显著性水平: 显著性水平 α = 0.05 检验统计量: 检验统计量 n = 10 ,s = 200 的样本的t 值 由于总体服从方差未知的正态分布,所以在 原假设下,检验统计量
X − µ0 4 000 − 4 200 = = − 3 .1 6 t= s 100 n 10
假设检验的步骤
1.确定原假设和备择假设 原假设和备择假设; 原假设和备择假设 2.选择检验统计量 检验统计量; 检验统计量 3.确定检验的显著性水平 α ; 显著性水平 4.用显著性水平来确定拒绝原假设 H 的检验统 计量的临界值、拒绝域; 临界值、拒绝域 临界值 5.根据样本数据,计算检验统计量的值 计算检验统计量的值; 计算检验统计量的值 6.⑴将统计量的值与临界值进行比较 将统计量的值与临界值进行比较,并作出 将统计量的值与临界值进行比较 决策:若统计量的值落在拒绝域内,拒绝原 假设 H 0,否则不拒绝原假设 H 0。 或⑵根据第5步的检验统计量的值计算 p 值。 计算 运用 p 值来确定是否拒绝。
总体比例的假设检验步骤:
⑴ 建立总体比例检验的原假设和备择假设; ⑵ 用样本比例 p 和样本标准差σ p 的来计算检 0 验统计量 Ζ= p−P 的值,
σp
因为是大样本,中心极限定理保证了统计量 p 服从正态分布,那么统计量z就近似服从正态 分布。 ⑶ 将检验统计量的值与临界值相比较,确定 是否应该拒绝原假设。
Ζ = X − µ0
σ
n
78 − 75 = = 1 .9 6 4 14 6
当 α = 0.05 时,对应的临界值为 Ζ0.05 = 1.645 因为 Ζ = 1.964 f 1.645 ,故否定原假设,这说明销 售方案更新后,周销售量有明显提高。
㈡ 总体方差未知时正态总体均值的假设检验
⑴如果样本数 n ≥ 30 ,根据中心极限定理,可 以假定抽样分布近似为正态概率分布; ⑵如果样本数 n p 30 ,但均值的抽样分布是正 态分布时。 无论哪一种情况,都应当使用T分布计算标准 的检验统计量,在计算检验统计量时,我们 用样本标准差 s 来代替总体标准差 σ 。 检验统计量
示例
[例8-3] 某商场销售一种产品,原每周销售量服
从平均值为75,方差为14的正态分布。销售方案 更新后,为了考察销售量是否提高,抽查了6周销 售量,求得平均销售量为78,假定方差不变,问 在显著性水平0.05下,销售方案更新后对周销售 量是否有显著提高?
计算过程
假设: 假设 H 0 : µ ≤ 7 5 ; H 1 : µ f 7 5 左单边检验 显著性水平: 显著性水平 α = 0.05 检验统计量: 检验统计量 n= 6 , 2 = 14 的样本的 Ζ 值 σ 由于总体服从方差已知的正态分布,所以在原 假设下,检验统计量
n(1− P) = 400×(1− 0.2) = 320 f 5
所以为大样本分布,检验统计量 Ζ 近似服从正 所以为大样本分布 态分布。样本数据显示
p =
Ζ=
100 = 0 .2 5 400
p − P0 = 0.25 − 0.20 0.2 (1 − 0.2 ) 400 = 0.05 = 2.5 0.02
㈢ 单侧检验与双侧检验
单侧检验是指检验统计量的取值位于其抽样 单侧检验 分布的某一侧范围内时拒绝原假设,也就是 说抽样分布的某一侧构成了拒绝域。 双侧检验是指检验统计量的取值位于其抽样 双侧检验 分布的任何一侧范围内时拒绝原假设,也就 是说抽样分布的左右两侧共同构成了拒绝域。
二、假设检验中的两类错误** 假设检验中的两类错误
µ ⑴ H 0 : ≥ µ0
H1 : µ p µ0
µ ⑵ H0 : ≤ µ0
µ ⑶ H0 : = µ
㈡ 拒绝域与检验统计量
拒绝域是指能够作出拒绝原假设这一结论的 拒绝域 所有可能的样本取值范围。 检验统计量是根据样本数据计算出来的,并 检验统计量 据以对原假设和备择假设作出决策的某种样 本统计量。
计师希望通过选取一个的样本计算样本均值来检验是否如 此。只有当样本均值与RMB260.00的假设值差别较大时, 审计师才会拒绝这个假设,已知应收账款金额的标准差 为 σ = 43.00 ,计算0.05显著性水平下假设检验的样本 均值临界值。 。
计算过程
假设: H 0 : µ = 2 6 0 .0 0 ; H 1 : µ ≠ 2 6 0 .0 0 显著性水平:α = 0 .0 5 n 检验统计量: = 36 , σ = 43.00 的样本的 X
示例
[例8-5] 某保龄球馆在过去几个月中,有20%
的顾客是女性。为了提高女顾客比例,球馆采取 了一些措施来吸引女性保龄球手。一周后随机抽 取400名球手作为样本,其中100名女球手。该球 馆经理要据此判断:在0.05的显著性水平下,该 球馆女性保龄球手的比例是否提高?
相关主题