当前位置:
文档之家› 第五章 抽样调查假设检验部分
第五章 抽样调查假设检验部分
... 因此我们拒 绝假设 = 50
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
提出假设 一种零件的生产标准是直径应为 10cm,为对生产过程 进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零 件的平均直径大于或小于10cm,则表明生产过程不正 常,必须进行调整。试陈述用来检验生产过程是否正 常的原假设和被择假设 解:根据不轻易拒绝原则,建立的原假设和备择 假设为
原假设为真时,拒绝原假设的概率 抽样分布的拒绝域 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 由研究者事先确定
(三)决策依据和规则
依据什么做出决策? 根据统计量
根据P值
根据统计量进行决策
在利用样本对总体进行统计推断时,往往是利用
样本统计量来进行决策,如果样本统计量算出来的 值落在接受区间,则接受原假设,若样本统计量算 出来的值落在拒绝区间,则拒绝原假设,那么接受 区间是拒绝区间是怎么算出来的呢?其临界值就是 要根据统计量的抽样分布和显著水平计算得到。
(四)一个总体参数的假设检验
1、总体均值的检验 (大样本N30)
使用z检验统计量
2 已知:
x -μ 0 z= ~ N(0, 1) σ n
2 未知:
x -μ 0 z= ~ N(0, 1) s n
某种罐装饮料采用自动生产线生产,每罐的容量是 255ml ,标准差为 5ml 。为检验每罐容量是否符合 要求,质检人员在某天生产的饮料中随机抽取了40 罐进行检验,测得每罐平均容量为 255.8ml。取显 著性水平 =0.05 ,检验该天生产的饮料容量是否 符合标准要求? 双侧检验
: = 255 H1 : 255 确定检验统计量:Z统计量 Z0.025 =1.96 显著性水平 = 0.05,临界值(c): Z0.975 Z0.025 1.96 接受区间为[-1.96,1.96] x -μ 255.8- 255 0= z = = 1.01 根据样本均值算出统计量 σ n 5 40 没有证据表明该天生产的饮料不符合标准要求
单侧检验中,P值通常为统计量分布曲线从检验 统计量从观察值到拒绝区域这一侧的面积。 左侧检验时,P值= P{ξ c } 右侧检验时,P值= P{ξ c } 双侧检验中,P值=单侧P值的2倍。即:
P值=2P{ξ ≥c },当 c 在右侧时;
或: P值=2P{ξ ≤c },当 c 在左侧时。
双侧检验的P 值:算出统计量临界值后 ,其统计量小于或大于临界值的概率
1.98 1.11
1.70 1.17
1.97 1.54
2.37 1.12
0.91 1.08
1.38 1.23
1.22 1.10
1.60 0.82
1.06 1.64
1.26 0.86
提出假设:H0 :
1.35H1 : <1.35 左侧检验 确定检验统计量:Z统计量 显著水平位 = 0.05,临界值 Z Z = 1.64 0.95 0.05 接受区间[-1.64, ) + 根据样本均值算出统计量:-2.6061
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/0
临界值
Z
计算出的样本统计量
左侧检验的P 值:算出统计量临界值后 ,其统计量小于临界值的概率
拒绝H0
P值
临界值
计算出的样本统计量
0
Z
右侧检验的P 值:算出统计量临界值后 ,其统计量大于临界值的概率
拒绝H0
P值
50个零件尺寸的误差数据 (mm) 1.26 1.13 1.19 0.96 1.31 1.06 0.97 1.00 1.81 0.94
0.98
1.12 1.23 0.99
1.10
1.12 0.74 1.45
1.12
0.95 1.50 1.24
1.03
1.02 0.50 1.01
1.16
1.13 0.59 2.03
备择假设的方向为“>”,称为右侧检验
双侧检验与单侧检验
以总体均值的检验为例
2008年8月
假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
H1 : ≠0
H1 : <0
H1 : >0
假设检验的基本思想 抽样分布
这个值不像我 们应该得到的 样本均值 ...
双侧检验
抽样分布
Region of Rejection
置信水平
Region of Rejection
拒绝H0
拒绝H0
/2
1-
Region of Nonrejection
/2
临界值
H0
临界值
左侧检验
抽样分布
Region of Rejection
置信水平
拒绝H0
1-
Region of Nonrejection
原假设为真 原假设为假
接受原假设 决策正确 第二类错误
拒绝原假设 第一类错误 决策正确
两类错误的控制 一般来说,对于一个给定的样本,如果犯第Ι类错 误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第
Ⅰ类错误的概率定得低些较为合理;反之,如果犯第
Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则 将犯第Ⅰ类错误的概率定得高些。 所以,一般来说,发生哪一类错误的后果更为严重 ,就应该首要控制哪类错误发生的概率。 但由于两种错误是此消彼长的关系,一般在假设检 验中,人们往往先控制第Ι类错误的发生概率
如:H0:药品没有毒
接受原假设 药品没有毒 决策正确 第二类错误 拒绝原假设 药品有毒 第一类错误 决策正确
原假设为真 药品没有毒 原假设为假 药品有毒
如:H0:药品有毒
显著性水平 (SIGNIFICANT LEVEL)
事先确定的用于拒绝原假设H0时所必须的证据 能够容忍的犯第Ⅰ类错误的最大概率(上限值)
确定假设:H0
拒绝 H0
0.005
拒绝 H0
0.005
-1.96
0
1.96
z
P值是当原假设为真时,出现样本观测结果或者更极 端结果的概率,
X 0 X 0 p( 》 1.01)=1-p( 1.01)=0.1562 / n / n P=2*0.1562=0.3124>0.05 因为出现样本观测值或更极端值的概率不是小概率事件,所以接受原假设。
-
一种机床加工的零件尺 寸 绝 对 平 均 误 差 为 1.35mm。生产厂家现采 用一种新的机床进行加 工以期进一步降低误差 。为检验新机床加工的 零件平均误差与旧机床 相比是否有显著降低, 从某天生产的零件中随 机抽取 50 个进行检验。 利用这些样本数据,检 验新机床加工的零件尺 寸的平均误差与旧机床 相比是否有显著降低?
双侧检验与单侧检验
1.
备择假设没有特定的方向性,并含有符号“” 的假设检验,称为双侧检验或双尾检验 (two-
tailed test)
2.
备择假设具有特定的方向性,并含有符号“ >”
或“ <” 的假设检验,称为单侧检验或单尾检验
(one-tailed test)
备择假设的方向为“<”,称为左侧检验
拒绝原假设,新机床加工的零件尺寸的平均误差与旧机床相 比有显著降低
验统计量取值的概率P,并与显著性水平比较。
(一)原假设和备择假设 原假设
1.
2.
3.
又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示 最初0假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它 总是有符号 =, 或 H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值 例如, H0 : 10cm 原假设的提出应本着“保守”或“不轻易拒绝 ”的原则来进行选择
临界值
H0
右侧检验
抽样分布
置信水平
Region of Rejection
拒绝H0
1-
Region of Nonrejection
2
H0
临界值
统计量决策规则
给定显著性水平,查表得出相应的临界值
将检验统计量的值与 水平的临界值进行比较
作出决策
双侧检验:|统计量|> 临界值,拒绝H0
左侧检验:统计量 < -临界值,拒绝H0
假设检验
什么是假设检验? (HYPOTHESIS TEST) 先对总体的参数(或分布形式)提出某种假设,然后
利用样本信息判断假设是否成立的统计方法
逻辑上运用反证法,统计上依据小概率原理
小概率事件与小概率原理
小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察 )中几乎不可能发生。 什么样的概率才算小概率?
(ALTERNATIVE HYPOTHESIS)
1.
备择假设
2.
3.
也称“研究假设” , 研究者想收集证据予以支 持的假设,用H1或Ha表示 备择假设通常用于表达研究者自己倾向于支持 的看法,然后就是想办法收集证据拒绝原假设 ,以支持备择假设 总是有符号 , 或< H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
(二)两类错误与显著性水平
研究者总是希望能做出正确的决策,但由于决 策是建立在样本信息的基础之上,而样本又是随机 的,因而就有可能犯错误 原假设和备择假设不能同时成立,决策的结果 要么拒绝H0,要么不拒绝H0。决策时总是希望当 原假设正确时没有拒绝它,当原假设不正确时拒绝 它,但实际上很难保证不犯错误 第Ⅰ类错误(错误) 原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为,被称为显著性水平 第Ⅱ类错误(错误) 原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为(Beta)