统计的假设检验概述
原假设实际上正确,这时我们做出了拒绝原假设的决策,因而
犯了错误.这类错误称为第Ⅰ类错误,也简称为弃真错误.我们无 法排
除犯这类错误的可能性,因此自然希望将犯这种错误的概率控制 在
一定的限度内。事实上,允许犯这类错误的概率最大为α,
即1-置信度, 在显
αP{称为拒显绝著H水0|平H。0 为关于真有}无≤显α著性差异的判断是
假设检验可如下进行: 例如,供应部的IC类材料的平均采购周期为大于50天,公司2001年对
采购流程进行了优化组合,供应部认为流程优化后IC类材料的采购周期 比原先缩短了,现在我们要确认流程优化后采购周期是否缩短了.
大家为了确认这种说法,可以作以下假设:
假设检验 : H0 : ≥ 50
一般把已知的事实设定为原假设.
著水平α之下做出的。
第二种错误 (Type Ⅱ Error)
原假设实际上不正确,这时我们做出了接受原假设的决策,因而
犯了错误.这类错误称为第Ⅱ类错误,也简称为伪错误. 实际上有 差
异,但我们认为“没有差异”,犯这种错误出现的概率.
β风险一般不P能{通接过受统H计0检| H验0直不接真求}得.
3. 使用问题1中的初值,要求将呼叫通话时间降低0.32分钟以达到 5.28分钟的平均值,这种情况下需要多少样本?
样本大小表 (比较2个样本时)
对两个样本已知δ与SIGMA时可利用下表求样本的大小( δ/SIGMA
计算及确定 与)
使用样本容量表需要了解什么?
1.d是需要检验的各平均值之间的差异大小。
性,增加样本大小可以较精确地证明差异。
在作统计假设检验时,如果我们自信地说它们之间有差异时,就尽量 减
少重复地带。
δ
δ
Stat > Power and Sample size > 2-Sample t
输入δ/ SIGMA值
输入1-β 值 输入标准偏差
大部分时 =5% =10%
输入α 值
▪ P-value为多少是好呢?
▪ - 一般 P-value<0.05,就拒绝原假设H0 ▪总得适用 5%的规则吗? ▪ - 不,根据情况可用 1%或 10% ▪ - 适用 1%: 第一种错误引起的损失大时 ▪ - 适用 10%: 损失不深刻时, 第二种错误 引 ▪ 起的损失大时.
在Minitab中我们 进行假设验证,P -value是我们判
H1 : < 50
我们要主张的设为原假设,我们真正 想确认的为备择假设
原假设和备择假设是关于总体的两个对立的解释。要么 原假设为真,要么备则假设为真。
假设检验的一般顺序是…
统计检验的一般顺序
1. 分析问题转化为统计问题 2. 确认目的 3. 进行假设(原假设/备择假设) 4. 选择统计的检验方法 5. 制定α危险度 6. 制定β危险度 7. 制定大家要寻找的δ或差异 8. 确定寻找δ必要的样本大小 9. 确定样本收集方法 10.收集数据 11. 统计的检验 12.以检验结果为基础,做出判断
从总体各抽取2个样本 的平均的分布
从总体各取30个 样本的平均分布.
什么是 P-value?
▪ P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率 ,简称P值。如果此值小,就下原假设为不真实的结论。统计学上称为
小概率事件,即样本不是从原假设的分布中抽出的。一般P值大于α,
则无法拒绝原假设,相反,P值小于α,则拒绝原假设。
为了加强检验能力,所用的数据要多。
检验统计量(Test Statistics)
– 我们做统计检验后得到的标准化的值(t,f,Chi_square值) 一般跟 P-value意义相同, 如果计算出来的检验统计量大于临界值, 就
采纳对立假设 H1
3. 样本的不正确性
为了解总体的特性,抽取样本时,样本要正确反映总体,受下列 要因的影响.
为什么需要假设检验?
总体:整个集合的全体特征 样本:具有总体特征的子集
根据样本确定总体!!!
总体参数与样本统计
总体参数
样本统计
平均 值
x
标准偏差
s
比例(百分數)
P
p
1. 总体参数(值)是固定的,但不知道。 2. 样本统计值是用来估计总体的特征。
假设是对总体值进行阐述,而不是对样本进行阐述。
假设检验如下…
断的基准
其它用语定义
显著性差异(Significant Difference)
– 统计性假设的结果不能看成是偶然的, 有很大差异时用的记法。
显著水平(Significance level)
– 犯第一零假设的内容与实际有差异时, 可以检验此差异的概率。(1- β)
• 通过从假定相等或没 有变化 (Ho)开始。
• 您通常想表明差异确 实存在的(H1)。
• 如果数据表明它们不相 等,则它们一定存在差 异(Ha)。
单侧检验,两侧检验
备择假设表示检验的特性值的范围在一侧或两侧. ■ 单侧验证(one-sided test)
备择假设中的特性值只在一侧的检验 (ⅰ) H1 : 0 ( 单侧检验 ) (ⅱ) H1 : 0 ( 单侧检验)
啊 !! 为了证明两个总体或几 个总体间之间差异进行 统计检验.
假设检验的种类有哪些?
那么!我们看一下我们经常用的假设检验的种类或什么时候用哪些检 验方法.
均值检验
方差检验
比率检验
· 1-Sample t test · Equal variance · 1-Proportion
检验 · 2-Sample t test test (F test) · 2-Proportion
在许多实际问题中,只能先对总体的某些参数做出可能的假设,然后根 据得到的样本,运用统计的知识对假设的正确性进行判断.这就是所谓 的统计假设检验
先看下面几个事例:
➢康讯生产部有一批用户板,按照规定的标准,单板的合格率应该达 ➢ 到99%,产检科从中任意抽取100件,发现其中有2块单板不合格.请 问 ➢ 这批用户板是否可以移交事业部? ➢供应一部IC类材料的采购日期以前平均为48天,现在对采购流程作 ➢ 了大的调整,收集了3个月IC类材料的采购周期的数据.试问:现在 的 ➢ 采购周期是否比以前缩短了? ➢康讯工艺部去年成立了焊接直通率项目团队,以前单板的焊点不良 ➢ 为98%,经过对工艺方面的改善, 试问:单板的焊点不良 率是否下 降 ➢ 了? ➢2001年度二营与三营不同销售人员的销售额有显著性差异
■ 两侧验证(two-sided test) 备择假设中的特性值在两侧的检验
(ⅲ) H1 : 0 (两侧检验)
双侧检验 单侧左检验 单侧右检验
单侧和双侧检验
/ 2
拒绝范围 (临界值)
无法拒绝HO
拒绝范围
/ 2
(临界值)
无法拒绝HO
拒绝范围 (临界值)
拒绝范围 (临界值)
无法拒绝HO
样本数选定错误时我们有可能无法得到我们想知道的。
d /SIGMA → d与 间的比率
d是指2个或1个的平均和一个基准值间的差异 SIGMA(s)是从样本分布得出的样本标准偏差.
d/大时,没有必要做统计检验可以说两个总体不同,因为差异( d )
很大.一般数据的分散()大时,有时证明差异较困难,为减少不真 实
真条件
无差异
有差异
真条件
无差异
有差异
无差异
统计的条件
不同
正确的 决定
第一种 错误 α
第二种 误差 β
正确的 决定
无差异
统计的条件
不同
正确的 决定
第一种 错误 α
第二种 误差 β
正确的 决定
什么是“显著性的(Significant)差异”?
显著性差异 (Significant Difference) :用于描述统计假设检验结 果的术语,即:差异大得不 能合理地归因于偶然因素。
样本或一个样本和一个基准值之间的差 异,
N=2样本的分布
从而断定总体是否存在差异。
在这里我们观察一下平均差异。样本的 大小
增加,对推断的平均值的标准偏差 (SE Mean)减少, 其结果我们发现差异的信息更多
d
N=30样本的分布
我们做出的判断更有可信性。
在右图表中n=2时理论分布的很多部 分都被重复。即无法区分属于哪一 个分布。
“备择假设”假定有差异或有关系.大部分的统计检验实际评价的 就是
原这假个设假(n设ull hypothesis) : H0
假设检验的起点是零假设-- H0。 H0是相同或没有差异的假设。 举例:总体均值等于检验均值。
备择假设(alternative hypothesis) : H1
第二条假设是H1-- 备择假设,即差异假设。 举例:总体均值不等于检验均值。
种类 · Paired t test
· Chi-square
· ANOVA
test
样本为正态分布时 主要 使用 使用的 了解一个或几个总体 情况 的平均值是否一致时
使用
了解一个或几个总体 的方差是否一致 时使用
了解一个或几个总体 的比率是否一致时 使用
数据 形态
连续型数据
离散型数据
假设检验如何与实际问题相结合?
• 抽样方法 • 样本间的变动 • 样本的大小
根据样本的判断总有可能出现错误,所以在假设检验时,错误发生 的事前管理是非常重要的.
在这种情况下,需要多少样本数据,有可能达到多少程度的准确性呢? 因此在假设检验中,应提前制定误差的允许范围,并按照其基准, 决定采纳或放弃假设。