当前位置:文档之家› 统计学 第6章 假设检验与方差分析

统计学 第6章 假设检验与方差分析

24
五、双侧检验和单侧检验
/2
–Z /2
1–
(a)双侧检验 Z / 2
/2


– Z
0 (b)左侧检验
0 Z (c)右侧检验
25
图6-1 双侧、单侧检验的拒绝域分配
表6-1 拒绝域的单、双侧与备择假设之间的对应关系
拒绝域 位置 双侧 左单侧
P-值检验的显著 性水平判断标准
原假设 H0:θ=θ0 H0:θ≥θ0
40
例: 已知初婚年龄服从正态分布。 根据9个人的调查结果,样本均值为 X 23.5 岁,样本标准差s=3岁。 问是否可以认为该地区初婚年龄数学期望以 及超过20岁( 0.05 )
41
(四)总体分布未知,总体方差未知,大样本 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设: H0: = 0,在H0成立的前提下,如果总体偏斜 适度,且样本足够大,近似地有检验统计量
29
• 在样本容量n不变的条件下,犯两类错误的 概率常常呈现反向的变化,要使和都同时 减小,除非增加样本的容量。 • 为此,统计学家奈曼与皮尔逊提出了一个原 则,即在控制犯第一类错误的概率情况下, 尽量使犯第二类错误的概率小。 • 在实际问题中,我们往往把要否定的陈述作 为原假设,而把拟采纳的陈述本身作为备择 假设,只对犯第一类错误的概率加以限制, 而不考虑犯第二类错误的概率 。
6
二、原假设与备择假设
• 原假设一般用H0表示,通常是设定总体参 数等于某值,或服从某个分布函数等; • 备择假设是与原假设互相排斥的假设,原 假设与备择假设不可能同时成立。 • 所谓假设检验问题实质上就是要判断H0是 否正确,若拒绝原假设H0 ,则意味着接受 备择假设H1 。
7
• 如在例6-1中,我们可以提出两个假设: • 假设平均袋装咖啡重量与所要控制的标 准没有显著差异,记为H0: = 150; • 假设平均袋装咖啡重量与所要控制的标 准有显著差异,记为H1: 150。
8
三、检验统计量
• 所谓检验统计量,就是根据所抽取的 样本计算的用于检验原假设是否成立 的随机变量。 • 检验统计量中应当含有所要检验的总 体参数,以便在“总体参数等于某数 值”的假定下研究样本统计量的观测 结果。
9
• 检验统计量还应该在“H0成立”的前 提下有已知的分布,从而便于计算出 现某种特定的观测结果的概率。
33
第二节 总体均值为某定值 的显著性检验
34
• 注意:
• 总体指在随机试验中所观测的随机变 量。
• 总体均值指的是随机变量的期望值。
35
总体均值的显著性检验包括:
• 双尾情况 • 左单尾 • 右单尾
36
• 如下就 • 总体分布的不同情况 • 总体方差是否已知的不同情况 • 样本大小的不同情况 分别介绍检验统计量和检验规则。
第六章 假设检验与方差分析
第一节 第二节 第三节 第四节 第五节 第六节 假设检验的基本原理 总体均值的假设检验 总体比例的假设检验 单因子方差分析 双因子方差分析 Excel在假设检验与方差 分析中的应用
掌握要点
• 假设检验的基本原理和步骤,以及相关概 念 • Z统计量、t统计量、F统计量的计算和应用 • 方差分析的基本概念 • 针对单因素、双因素的方差分析构造F统计 量
37
(一)总体为正态分布,总体方差已知,样 本不论大小 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设: H0: = 0,在H0成立的前提下,有检验统 计量
Z
X 0

2
~ N (0,1)
n
38
(二)总体分布未知,总体方差已知,大样本 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设: H0: = 0,在H0成立的前提下,如果样本足 够大(n≥30),近似地有检验统计量
4
• 所谓假设检验,就是事先对总体的参 数或总体分布形式做出一个假设,然 后利用抽取的样本信息来判断这个假 设(原假设)是否合理,即判断总体 的真实情况与原假设是否存在显著的 系统性差异,所以假设检验又被称为 显著性检验。
5
• 一个完整的假设检验过程,包括以下几 个步骤: (1)提出假设; (2)构造适当的检验统计量,并根 据样本计 算统计量的具体数值; (3)规定显著性水平,建立检验规 则; (4)做出判断。
• 至于小概率的标准是多大?这要根据实际问 题而定。 • 假设检验中,称这一标准为显著性水平,用 来表示。 • 在应用中,通常取 =0.01, =0.05。一般 来说,犯第一类错误可能造成的损失越大, 的取值应当越小。 • 对假设检验问题做出判断可依据两种规则: • 一是P-值规则; • 二是临界值规则。
10
例6-2
• 构造例6-1的检验统计量,并计算相应的 样本观测值。
11
解: H 0 : 150, H 1 : 150 。 由于咖啡的分袋包装生产线的装袋重量服从正态分 布,所以其简单随机样本的均值 X 也服从正态分布。 我们把 X 标准化成为标准正态变量
Z X E( X ) V (X ) ~ N (0 , 1)
15
(一)P-值规则
所谓P-值,实际上是检验统计量超过 (大于或小于)具体样本观测值的概率。 如果P-值小于所给定的显著性水平, 则认为原假设不太可能成立; 如果P-值大于所给定的标准,则认 为没有充分的证据否定原假设。
16
例6-3
• 假定 =0.05,根据例6-2的结果,计 算该问题的P-值,并做出判断。
30
七、关于假设检验结论的理解
• 这就是说,在假设检验中,相对而言, 当原假设被拒绝时,我们能够以较大 的把握肯定备择假设的成立。而当原 假设未被拒绝时,我们并不能认为原 假设确实成立。
31
注意:显著性检验到底回答了什么 样的问题?
• 显著性检验只是回答了所观察到的差 异(样本数据与我们对总体所作的推 测之间的差异)是纯属于机会变异, 还是反映了真实的差异?
Z
X 0 s n
2
~ N (0,1)
42
例6-5
• 某厂采用自动包装机分装产品,假定每包 产品的重量服从正态分布,每包标准重量 为1000克,某日随机抽查9包,测得样本平 均重量为986克,样本标准差是24克。 • 试问在α=0.05的显著性水平上,能否认为 这天自动包装机工作正常?
18
• 例: • 某电视机厂声称其产品耐用时间超过 1200小时。随机抽取100件产品后测得 均值为1251小时,标准差s=300小时。 • 问该厂产品耐用时间是否高于1200小时? • (显著水平0.05)
19
(二)临界值规则
• 假设检验中,还有另外一种做出结论的 方法: • 根据所提出的显著性水平标准(它是概 率密度曲线的尾部面积)查表得到相应 的检验统计量的数值,称作临界值。 • 直接用检验统计量的观测值与临界值作 比较,观测值落在临界值所划定的尾部 (称之为拒绝域)内,便拒绝原假设;
17
• 解:查标准正态概率表, • 当z=2.29时,阴影面积为0.9890,尾部面积 为1-0.9890=0.011,由对称性可知,当z= – 2.29时,左侧面积为0.011。 0.011≤/2=0.025 0.011这个数字意味着,假若我们反复抽取 n=100的样本,在100个样本中仅有可能出现 一个使检验统计量等于或小于–2.29的样本。 该事件发生的概率小于给定的显著性水平, 所以,可以判断μ=150的假定是错误的,也就 是说,根据观测的样本,有理由表明总体的 与150克的差异是显著存在的。
2
第一节 假设检验的基本原理
一 什么是假设检验
二 原假设与备择假设
三 检验统计量 四 显著性水平、P-值与临界值
五 双侧检验和单侧检验 六 假设检验的两类错误 七 关于假设检验结论的理解
3
一、什么是假设检验
• 例6-1:假定咖啡的分袋包装生产线的装袋 重量服从正态分布N(μ,σ2)。生产线按每袋 净重150克的技术标准控制操作。现从生产 线抽取简单随机样本n=100袋,测得其平均 重量为 X =149.8克,样本标准差S=0.872 克。问该生产线的装袋净重的期望值是否为 150克(即问生产线是否处于控制状态)?
27
• 显著性检验中的第二类错误是指: • 原假设事实上不正确,而检验统计量的观 测值却落入了不能拒绝域,因而没有否定 本来不正确的原假设,这是取伪的错误。 • 发生第二类错误的概率是把来自 θ=θ1(θ1≠θ0)的总体的样本值代入检验统计 量所得结果落入接受域的概率。
ቤተ መጻሕፍቲ ባይዱ28
• 根据不同的检验问题,对于和大小的选择 有不同的考虑。 • 例如,在例6-1中,如果检验者站在卖方的 立场上,他较为关心的是不要犯第一类错误, 即不要发生产品本来合格却被错误地拒收这 样的事情,这时, 要较小。 • 反之,如果检验者站在买者的立场上,他关 心的是不要把本来不合格的产品误当作合格 品收下,也就是说,最好不要犯第二类错误, 因此, 要较小。
Z
X 0

2
~ N (0,1)
n
39
(三)总体为正态分布,总体方差未知,小 样本 • 来自总体的样本为(x1, x2, …, xn)。对于假设: H0: = 0,在H0成立的前提下,有检验统计 量
t
X 0
S
2
~ t ( n 1)
n • 若自由度(n-1)≥30,该t统计量近似服从标准 正态分布。
20
• 观测值落在临界值所划定的尾部之外 (称之为不能拒绝域)的范围内,则认 为拒绝原假设的证据不足。这种做出检 验结论的方法,我们称之为临界值规则。
21
• 显然,P-值规则和临界值规则是等价的。在 做检验的时候,只用其中一个规则即可。 • P-值规则较之临界值规则具有更明显的优点。 • 这主要是: • 第一,它更加简捷; • 第二,在值规则的检验结论中,对于犯第一 类错误的概率的表述更加精确。 • 推荐使用P-值规则。
相关主题