当前位置:文档之家› 第七章 假设检验与方差分析

第七章 假设检验与方差分析

3. 作出决策
– 双侧检验:统计量的绝对值 > 临界值,拒绝H
0
– 左侧检验:统计量 < -临界值,拒绝H0 – 右侧检验:统计量 > 临界值,拒绝H0
用P 值决策
(P-value)
1. 如果原假设为真,所得到的样本结果会像实际观 测结果那么极端或更极端的概率
• P值告诉我们:如果原假设是正确的话,我们
H0 : m 30%
H1 : m 30%
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
– 在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同
3. P值越小,你拒绝原假设的理由就越充分
多大的P 值合适?
• ☺ 要证明原假设不正确,P值要多小,才能令人 信服呢?
✓ 原假设的可信度又多高?如果H0所代表的假设 是人们多年来一直相信的,就需要很强的证据(
小的P值)才能说服他们
✓ 拒绝的结论是什么?如果拒绝H0而肯定H1 ,你 就需要有很强的证据显示要支持H1。比如,H1 代表要花很多钱把产品包装改换成另一种包装 ,你就要有很强的证据显示新包装一定会增加 销售量(因为拒绝H0要花很高的成本)
2、原假设和备择假设
研究者想收集证据予以反对的假设
又称零假设 原

总是有符号=,≤或≥

表示为H又称研究假设
择 假
总是有符号≠,<或>

表示为H1
H1:m<某一数值,或H1:m>某一数值
3、假设检验的基本思想
假定原假设为真

检验结

不拒绝原假设
——Jan Kmenta
一、假设检验的基本问题
(一)假设检验的基本思想 1、什么是假设检验?
对总体的概率分布或分布参数做出某种假设,然后根据抽 样得到的样本观察值,运用数理统计的分析方法,检验这种假 设是否正确,从而决定接受或拒绝假设,这样的统计推断过程 就是假设检验,也称显著性检验。
如:某企业生产的某种导线,按照质量标准,导线的平均 拉力强度为1200公斤。那么事先假设这批导线的平均拉力强度 为1200公斤,在出厂时抽取100根进行检验,测得其平均拉力 强度,以此来检验所作假设的正确性。
第七章 假设检验与方差分析
假设检验的基本问题 单个总体参数的假设检验 两个总体参数的假设检验 方差分析
教学目的与要求
1、熟悉假设检验的基本原理 2、掌握单个总体参数的假设检验方法 3、了解两个总体参数的假设检验方法 4、了解方差分析的方法
统计名言 正如一个法庭宣告某一判决 为 “ 无 罪 (not guilty)” 而 不 为 “ 清 白 (innocent)” , 统 计 检验的结论也应为“不拒绝” 而不为“接受”。
态度
假设检验中的两类错误
对假设H0
采取的行动
H0为真
不拒绝H0
正确
H0为假
犯第二类错误
态度
否定H0
犯第一类错误
正确
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ 类错误的概率定得低些较为合理;反之,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低,则将 犯第Ⅰ类错误的概率定得高些
固定显著性水平是否有意义
1. 有了P值,我们并不需要用5%或1%这类传统的显著 性水平。P值提供了更多的信息,它让我们可以选择 任意水平来评估结果是否具有统计上的显著性,从而 可根据我们的需要来决定是否要拒绝原假设 – 只要你认为这么大的P值就算是显著了,你就可 以在这样的P值水平上拒绝原假设
2. 传统的显著性水平,如1%、5%、10%等等,已经被 人们普遍接受为“拒绝原假设足够证据”的标准,我们 大概可以说:10%代表有“一些证据”不利于原假设; 5%代表有“适度证据”不利于原假设;1%代表有“很 强证据”不利于原假设
2. 一般来说,发生哪一类错误的后果更为严重,就应该 首要控制哪类错误发生的概率。但由于犯第Ι类错误 的概率是可以由研究者控制的,因此在假设检验中, 人们往往先控制第Ι类错误的发生概率
显著性水平
(significant level)
1. 事先确定的用于拒绝原假设H0时所必须的证据 2. 能够容忍的犯第Ⅰ类错误的最大概率(上限值) • 原假设为真时,拒绝原假设的概率
255.8ml。取显著性水平=0.05 ,检验该天生产
的饮料容量是否符合标准要求?
双侧检验
总体均值的检验( 2 已知)
(例题分析-大样本)
•H0 :m = 255 •H1 :m 255 已知 = 0.05
•n = 40
•临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
拒绝H0
1/2 P 值
Z
临界值 0
计算出的样本统计量
右侧检验的P 值
拒绝H0
1/2 P 值
0
Z
临界值
计算出的样本统计量
P值是关于数据的概率
1. P值与原假设的对或错的概率无关 2. 它反映的是在某个总体的许多样本中某一类数据出
现的经常程度,它是当原假设正确时,得到目前这 个样本数据的概率
– 比如,要检验全校学生的平均生活费支出是否等于500元, 检验的假设为H0:m=500;H0:m500 。假定抽出一个样 本算出的样本均值600元,得到的值为P=0.02,这个0.02 是指如果平均生活费支出真的是500元的话,那么,从该总 体中抽出一个均值为600的样本的概率仅为0.02。如果你 认为这个概率太小了,就可以拒绝原假设,因为如果原假 设正确的话,几乎不可能抓到这样的一个样本,既然抓到 了,就表明这样的样本不在少数,所以原假设是不对的
1-
Region of Nonrejecti on
临界值
H0
用统计量决策
(右侧检验 )
抽样分布
置信水平
Region of Rejection
拒绝H0
1-
2
Region of Nonrejecti on
H0
临界值
统计量决策规则
1. 给定显著性水平,查表得出相应的临界值z或z/2
, t或t/2
2. 将检验统计量的值与 水平的临界值进行比较
H0 : m 10cm H1 : m 10cm
提出假设
(例题分析)
• 【例】某品牌洗涤剂在它的产品说明书中声称 :平均净含量不少于500克。从消费者的利益出 发,有关研究人员要通过抽检其中的一批产品 来验证该产品制造商的说明是否属实。试陈述 用于检验的原假设与备择假设
解:研究者抽检的意图是倾向于证实这种洗涤 剂的平均净含量并不符合说明书中的陈述 。 建立的原假设和备择假设为
• 抽样分布的拒绝域
• 表示为 (alpha)
• 常用的 值有0.01, 0.05, 0.10
• 由研究者事先确定
依据什么做出决策?
1. 若假设为H0≥500, H1<500。样本均值为49 5,拒绝H0吗?样本均值为502,拒绝H0吗?
2. 做出拒绝或不拒绝原假设的依据是什么? 3. 传统上,做出决策所依据的是样本统计量,现
代检验中人们直接使用由统计量算出的犯第Ⅰ 类错误的概率,即所谓的P值
检验统计量(test statistic)
1. 根据样本观测结果计算出对原假设和备择假设做 出决策某个样本统计量
2. 对样本估计量的标准化结果
– 原假设H0为真
– 点估计量的抽样分布
3. 标准化的检验统计量
标准化检验统计量
点估计量 — 假设值 点估计量的抽样标准差
P 值决策与统计量的比较
1. 用P值进行检验比根据统计量检验提供更多的信息 2. 统计量检验是我们事先给出的一个显著性水平,以
此为标准进行决策,无法知道实际的显著性水平究 竟是多少
– 比如,根据统计量进行检验时,只要统计量的值落在拒 绝域,我们拒绝原假设得出的结论都是一样的,即结果 显著。但实际上,统计量落在拒绝域不同的地方,实际 的显著性是不同的。比如,统计量落在临界值附近与落 在远离临界值的地方,实际的显著性就有较大差异。而 P值给出的是实际算出的显著水平,它告诉我们实际的 显著性水平是多少
二、单个总体参数的假设检验
(一)总体均值的检验 (大样本) 1. 假定条件
– 大样本(n30) 2. 使用z检验统计量
2 已知:z x m0 ~ N (0,1) n
2 未知:z x m0 ~ N (0,1)
sn
总体均值的检验( 2 已知)
(例题分析—大样本)
•【例】一种罐装饮料采用自动生产线生产,每罐 的容量是255ml,标准差为5ml。为检验每罐容 量是否符合要求,质检人员在某天生产的饮料中 随机抽取了40罐进行检验,测得每罐平均容量为
H0 : m 500
H1 : m < 500
提出假设
(例题分析)
• 【例】一家研究机构估计,某城市中家庭拥有 汽车的比例超过30%。为验证这一估计是否正 确,该研究机构随机抽取了一个样本进行检验 。试陈述用于检验的原假设与备择假设
解:研究者想收集证据予以支持的假设 是“该城市中家庭拥有汽车的比例超过3 0%”。建立的原假设和备择假设为
2. 原假设和备择假设不能同时成立,决策的结果要 么拒绝H0,要么不拒绝H0。决策时总是希望当原 假设正确时没有拒绝它,当原假设不正确时拒绝 它,但实际上很难保证不犯错误
(三)假设检验的两类错误
第一类错误
原假设为真,而拒绝原假设 概率记为,也称显著性水平
第二类错误
相关主题