当前位置：文档之家› 统计的假设检验概述

统计的假设检验概述

原假设实际上正确，这时我们做出了拒绝原假设的决策,因而
犯了错误.这类错误称为第Ⅰ类错误,也简称为弃真错误.我们无法排
除犯这类错误的可能性，因此自然希望将犯这种错误的概率控制在
一定的限度内。事实上，允许犯这类错误的概率最大为α，

即1-置信度，在显
αP｛称为拒显绝著H水0|平H。0 为关于真有｝无≤显α著性差异的判断是
假设检验可如下进行: 例如,供应部的IC类材料的平均采购周期为大于50天,公司2001年对
采购流程进行了优化组合,供应部认为流程优化后IC类材料的采购周期比原先缩短了,现在我们要确认流程优化后采购周期是否缩短了.
大家为了确认这种说法,可以作以下假设：
假设检验 : H0 : ≥ 50
一般把已知的事实设定为原假设.
著水平α之下做出的。
第二种错误 (Type Ⅱ Error)
原假设实际上不正确，这时我们做出了接受原假设的决策,因而
犯了错误.这类错误称为第Ⅱ类错误,也简称为伪错误. 实际上有差
异，但我们认为“没有差异”，犯这种错误出现的概率.
β风险一般不P能｛通接过受统H计0检| H验0直不接真求｝得.
3. 使用问题1中的初值，要求将呼叫通话时间降低0.32分钟以达到 5.28分钟的平均值，这种情况下需要多少样本?
样本大小表 (比较2个样本时)
对两个样本已知δ与SIGMA时可利用下表求样本的大小（ δ/SIGMA
计算及确定与)
使用样本容量表需要了解什么？
1.d是需要检验的各平均值之间的差异大小。
性，增加样本大小可以较精确地证明差异。
在作统计假设检验时，如果我们自信地说它们之间有差异时，就尽量减
少重复地带。
δ
δ

Stat > Power and Sample size > 2-Sample t
输入δ/ SIGMA值
输入1-β 值输入标准偏差
大部分时 =5% =10%
输入α 值
▪ P-value为多少是好呢?
▪ - 一般 P-value<0.05,就拒绝原假设H0 ▪总得适用 5%的规则吗? ▪ - 不,根据情况可用 1%或 10% ▪ - 适用 1%: 第一种错误引起的损失大时 ▪ - 适用 10%: 损失不深刻时, 第二种错误引 ▪ 起的损失大时.
在Minitab中我们进行假设验证，P －value是我们判
H1 : < 50
我们要主张的设为原假设,我们真正想确认的为备择假设
原假设和备择假设是关于总体的两个对立的解释。要么原假设为真，要么备则假设为真。
假设检验的一般顺序是…
统计检验的一般顺序
1. 分析问题转化为统计问题 2. 确认目的 3. 进行假设(原假设/备择假设) 4. 选择统计的检验方法 5. 制定α危险度 6. 制定β危险度 7. 制定大家要寻找的δ或差异 8. 确定寻找δ必要的样本大小 9. 确定样本收集方法 10.收集数据 11. 统计的检验 12.以检验结果为基础,做出判断
从总体各抽取2个样本的平均的分布
从总体各取30个样本的平均分布.
什么是 P-value?
▪ P-value是原假设H0真实的结论时，我们观察到样本的值有多大的概率，简称P值。如果此值小，就下原假设为不真实的结论。统计学上称为
小概率事件，即样本不是从原假设的分布中抽出的。一般P值大于α，
则无法拒绝原假设，相反，P值小于α，则拒绝原假设。
为了加强检验能力，所用的数据要多。

检验统计量(Test Statistics)
– 我们做统计检验后得到的标准化的值(t,f,Chi_square值) 一般跟 P-value意义相同, 如果计算出来的检验统计量大于临界值, 就
采纳对立假设 H1
3. 样本的不正确性
为了解总体的特性，抽取样本时，样本要正确反映总体，受下列要因的影响.
为什么需要假设检验？
总体：整个集合的全体特征样本：具有总体特征的子集
根据样本确定总体!!!
总体参数与样本统计
总体参数
样本统计
平均值

x
标准偏差

s
比例(百分數)
P
p
1. 总体参数(值)是固定的，但不知道。 2. 样本统计值是用来估计总体的特征。
假设是对总体值进行阐述，而不是对样本进行阐述。
假设检验如下…
断的基准
其它用语定义
显著性差异(Significant Difference)
– 统计性假设的结果不能看成是偶然的, 有很大差异时用的记法。
显著水平(Significance level)
– 犯第一零假设的内容与实际有差异时, 可以检验此差异的概率。（1- β）
• 通过从假定相等或没有变化 (Ho)开始。
• 您通常想表明差异确实存在的(H1)。
• 如果数据表明它们不相等，则它们一定存在差异(Ha)。
单侧检验,两侧检验
备择假设表示检验的特性值的范围在一侧或两侧. ■ 单侧验证(one-sided test)
备择假设中的特性值只在一侧的检验 (ⅰ) H1 : 0 ( 单侧检验 ) (ⅱ) H1 : 0 ( 单侧检验)
啊 !! 为了证明两个总体或几个总体间之间差异进行统计检验.
假设检验的种类有哪些?
那么!我们看一下我们经常用的假设检验的种类或什么时候用哪些检验方法.
均值检验
方差检验
比率检验
· 1-Sample t test · Equal variance · 1-Proportion
检验 · 2-Sample t test test (F test) · 2-Proportion
在许多实际问题中,只能先对总体的某些参数做出可能的假设,然后根据得到的样本,运用统计的知识对假设的正确性进行判断.这就是所谓的统计假设检验
先看下面几个事例:
➢康讯生产部有一批用户板,按照规定的标准,单板的合格率应该达 ➢ 到99%,产检科从中任意抽取100件,发现其中有2块单板不合格.请问 ➢ 这批用户板是否可以移交事业部? ➢供应一部IC类材料的采购日期以前平均为48天,现在对采购流程作 ➢ 了大的调整,收集了3个月IC类材料的采购周期的数据.试问:现在的 ➢ 采购周期是否比以前缩短了? ➢康讯工艺部去年成立了焊接直通率项目团队,以前单板的焊点不良 ➢ 为98%,经过对工艺方面的改善, 试问:单板的焊点不良率是否下降 ➢ 了? ➢2001年度二营与三营不同销售人员的销售额有显著性差异
■ 两侧验证(two-sided test) 备择假设中的特性值在两侧的检验
(ⅲ) H1 : 0 (两侧检验)
双侧检验单侧左检验单侧右检验
单侧和双侧检验
/ 2
拒绝范围 (临界值)
无法拒绝HO
拒绝范围
/ 2
(临界值)
无法拒绝HO

拒绝范围 (临界值)

拒绝范围 (临界值)
无法拒绝HO
样本数选定错误时我们有可能无法得到我们想知道的。
d /SIGMA → d与间的比率
d是指2个或1个的平均和一个基准值间的差异 SIGMA(s)是从样本分布得出的样本标准偏差.
d/大时，没有必要做统计检验可以说两个总体不同，因为差异（ d ）
很大.一般数据的分散（）大时，有时证明差异较困难，为减少不真实
真条件
无差异
有差异
真条件
无差异
有差异
无差异
统计的条件
不同
正确的决定
第一种错误 α
第二种误差 β
正确的决定
无差异
统计的条件
不同
正确的决定
第一种错误 α
第二种误差 β
正确的决定
什么是“显著性的(Significant)差异”?

显著性差异 (Significant Difference) ：用于描述统计假设检验结果的术语，即：差异大得不能合理地归因于偶然因素。
样本或一个样本和一个基准值之间的差异，
N=2样本的分布
从而断定总体是否存在差异。
在这里我们观察一下平均差异。样本的大小
增加，对推断的平均值的标准偏差 (SE Mean)减少，其结果我们发现差异的信息更多
d
N=30样本的分布
我们做出的判断更有可信性。
在右图表中n=2时理论分布的很多部分都被重复。即无法区分属于哪一个分布。
“备择假设”假定有差异或有关系.大部分的统计检验实际评价的就是
原这假个设假(n设ull hypothesis) : H0
假设检验的起点是零假设-- H0。 H0是相同或没有差异的假设。举例：总体均值等于检验均值。
备择假设(alternative hypothesis) : H1
第二条假设是H1-- 备择假设，即差异假设。举例：总体均值不等于检验均值。
种类 · Paired t test
· Chi-square
· ANOVA
test
样本为正态分布时主要使用使用的了解一个或几个总体情况的平均值是否一致时
使用
了解一个或几个总体的方差是否一致时使用
了解一个或几个总体的比率是否一致时使用
数据形态
连续型数据
离散型数据
假设检验如何与实际问题相结合?
• 抽样方法 • 样本间的变动 • 样本的大小
根据样本的判断总有可能出现错误，所以在假设检验时，错误发生的事前管理是非常重要的.
在这种情况下，需要多少样本数据，有可能达到多少程度的准确性呢？因此在假设检验中，应提前制定误差的允许范围，并按照其基准，决定采纳或放弃假设。

e商务文档

统计的假设检验概述

相关文档推荐：