当前位置：文档之家› 第七章假设检验与方差分析

第七章假设检验与方差分析

3. 作出决策
– 双侧检验：统计量的绝对值 > 临界值，拒绝H
0
– 左侧检验：统计量 < -临界值，拒绝H0 – 右侧检验：统计量 > 临界值，拒绝H0
用P 值决策
(P-value)
1. 如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率
• P值告诉我们：如果原假设是正确的话，我们
H0 ： m 30%
H1 ： m 30%
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组，而且相互对立
– 在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立
2. 先确定备择假设，再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同，对同一问题可能提出不同
3. P值越小，你拒绝原假设的理由就越充分
多大的P 值合适?
• ☺ 要证明原假设不正确，P值要多小，才能令人信服呢？
✓ 原假设的可信度又多高？如果H0所代表的假设是人们多年来一直相信的，就需要很强的证据(
小的P值)才能说服他们
✓ 拒绝的结论是什么？如果拒绝H0而肯定H1 ，你就需要有很强的证据显示要支持H1。比如，H1 代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)
2、原假设和备择假设
研究者想收集证据予以反对的假设
又称零假设原
假
总是有符号=，≤或≥
设
表示为H又称研究假设
择假
总是有符号≠，＜或＞
设
表示为H1
H1：m＜某一数值，或H1：m＞某一数值
3、假设检验的基本思想
假定原假设为真
错
检验结
果
不拒绝原假设
——Jan Kmenta
一、假设检验的基本问题
（一）假设检验的基本思想 1、什么是假设检验？
对总体的概率分布或分布参数做出某种假设，然后根据抽样得到的样本观察值，运用数理统计的分析方法，检验这种假设是否正确，从而决定接受或拒绝假设，这样的统计推断过程就是假设检验，也称显著性检验。
如：某企业生产的某种导线，按照质量标准，导线的平均拉力强度为1200公斤。那么事先假设这批导线的平均拉力强度为1200公斤，在出厂时抽取100根进行检验，测得其平均拉力强度，以此来检验所作假设的正确性。
第七章假设检验与方差分析
假设检验的基本问题单个总体参数的假设检验两个总体参数的假设检验方差分析
教学目的与要求
1、熟悉假设检验的基本原理 2、掌握单个总体参数的假设检验方法 3、了解两个总体参数的假设检验方法 4、了解方差分析的方法
统计名言正如一个法庭宣告某一判决为 “ 无罪 (not guilty)” 而不为 “ 清白 (innocent)” ，统计检验的结论也应为“不拒绝” 而不为“接受”。
态度
假设检验中的两类错误
对假设H0
采取的行动
H0为真
不拒绝H0
正确
H0为假
犯第二类错误
态度
否定H0
犯第一类错误
正确
两类错误的控制
1. 一般来说，对于一个给定的样本，如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高，则将犯第Ⅰ 类错误的概率定得低些较为合理；反之，如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低，则将犯第Ⅰ类错误的概率定得高些
固定显著性水平是否有意义
1. 有了P值，我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息，它让我们可以选择任意水平来评估结果是否具有统计上的显著性，从而可根据我们的需要来决定是否要拒绝原假设 – 只要你认为这么大的P值就算是显著了，你就可以在这样的P值水平上拒绝原假设
2. 传统的显著性水平，如1%、5%、10%等等，已经被人们普遍接受为“拒绝原假设足够证据”的标准，我们大概可以说：10%代表有“一些证据”不利于原假设； 5%代表有“适度证据”不利于原假设；1%代表有“很强证据”不利于原假设
2. 一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第Ι类错误的发生概率
显著性水平
(significant level)
1. 事先确定的用于拒绝原假设H0时所必须的证据 2. 能够容忍的犯第Ⅰ类错误的最大概率(上限值) • 原假设为真时，拒绝原假设的概率
255.8ml。取显著性水平=0.05 ，检验该天生产
的饮料容量是否符合标准要求？
双侧检验
总体均值的检验( 2 已知)
(例题分析－大样本)
•H0 ：m = 255 •H1 ：m 255 已知 = 0.05
•n = 40
•临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
拒绝H0
1/2 P 值
Z
临界值 0
计算出的样本统计量
右侧检验的P 值
拒绝H0
1/2 P 值
0
Z
临界值
计算出的样本统计量
P值是关于数据的概率
1. P值与原假设的对或错的概率无关 2. 它反映的是在某个总体的许多样本中某一类数据出
现的经常程度，它是当原假设正确时，得到目前这个样本数据的概率
– 比如，要检验全校学生的平均生活费支出是否等于500元，检验的假设为H0：m=500；H0：m500 。假定抽出一个样本算出的样本均值600元，得到的值为P=0.02，这个0.02 是指如果平均生活费支出真的是500元的话，那么，从该总体中抽出一个均值为600的样本的概率仅为0.02。如果你认为这个概率太小了，就可以拒绝原假设，因为如果原假设正确的话，几乎不可能抓到这样的一个样本，既然抓到了，就表明这样的样本不在少数，所以原假设是不对的
1-
Region of Nonrejecti on
临界值
H0
用统计量决策
(右侧检验 )
抽样分布
置信水平
Region of Rejection
拒绝H0
1-
2
Region of Nonrejecti on
H0
临界值
统计量决策规则
1. 给定显著性水平，查表得出相应的临界值z或z/2
， t或t/2
2. 将检验统计量的值与水平的临界值进行比较
H0 ： m 10cm H1 ： m 10cm
提出假设
(例题分析)
• 【例】某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500克。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设
解：研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为
• 抽样分布的拒绝域
• 表示为 (alpha)
• 常用的值有0.01, 0.05, 0.10
• 由研究者事先确定
依据什么做出决策？
1. 若假设为H0≥500， H1<500。样本均值为49 5，拒绝H0吗？样本均值为502，拒绝H0吗？
2. 做出拒绝或不拒绝原假设的依据是什么？ 3. 传统上，做出决策所依据的是样本统计量，现
代检验中人们直接使用由统计量算出的犯第Ⅰ 类错误的概率，即所谓的P值
检验统计量(test statistic)
1. 根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量
2. 对样本估计量的标准化结果
– 原假设H0为真
– 点估计量的抽样分布
3. 标准化的检验统计量
标准化检验统计量
点估计量 — 假设值点估计量的抽样标准差
P 值决策与统计量的比较
1. 用P值进行检验比根据统计量检验提供更多的信息 2. 统计量检验是我们事先给出的一个显著性水平，以
此为标准进行决策，无法知道实际的显著性水平究竟是多少
– 比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而 P值给出的是实际算出的显著水平，它告诉我们实际的显著性水平是多少
二、单个总体参数的假设检验
（一）总体均值的检验 (大样本) 1. 假定条件
– 大样本(n30) 2. 使用z检验统计量
2 已知：z x m0 ~ N (0,1) n
2 未知：z x m0 ~ N (0,1)
sn
总体均值的检验( 2 已知)
(例题分析—大样本)
•【例】一种罐装饮料采用自动生产线生产，每罐的容量是255ml，标准差为5ml。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了40罐进行检验，测得每罐平均容量为
H0 ： m 500
H1 ： m < 500
提出假设
(例题分析)
• 【例】一家研究机构估计，某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设
解：研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过3 0%”。建立的原假设和备择假设为
2. 原假设和备择假设不能同时成立，决策的结果要么拒绝H0，要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误
（三）假设检验的两类错误
第一类错误
原假设为真，而拒绝原假设概率记为，也称显著性水平
第二类错误

e商务文档

第七章假设检验与方差分析

相关文档推荐：

e商务文档

第七章 假设检验与方差分析

相关文档推荐：

第七章假设检验与方差分析