当前位置:文档之家› 假设检验经典培训教材

假设检验经典培训教材

假设检验
培训资料 二OO四年二月二十五日
目的:
熟悉连续变量和逻辑变量的假设检验。
目标: 完成该章你将能够: 1) 写假设检验--原假设和备择假设。 2) 解释假设检验的结果。
情况: 在三个不同的销售区域使用相同促销方法,销售量分别是:
A区: 1000 B区: 850 C区: 700
“历史”的解释方法: 销售VP给A区经理较多的奖金。 销售VP考虑换 掉C区 经理。
2. 从给定流程取得的样本 可能有所不同
3. 如何区分基于样本的“几率性 ”差异和真正的流程差异?
真实情况
Ho
Ha
无罪
有罪
真实情况
Ho
Ha
Ho 释放 无罪释放 有罪, 释放
判决
Ha 监禁
无罪, 有罪,
监禁
监禁
Ho 正确判决 II 类 错误b
接受
Ha
I类
正确判决
错误a
Ho
Ha
b
a
临界限制
a 和 b 处在不同区域;故我们不可能同时 犯 I 类和 II 类错误
0.411326 0.40
0.35
0.35375
0.30 A
B
C
D
E
0.296174 F
方差分析: ANOVA
• 单因子ANOVA:检验有一个变量时,总体平均值是否相等 • 双因子ANOVA:检验有两 个变量时,总体平均值是否相等
• ANOVA-General Linear Model:检验有两个以上变量时,总体平均 值是否相等
Adj SS 0.0505 3.8860 0.0630 4.2526 0.0159 0.6918
Adj MS 0.0505 1.2953 0.0210 4.2526 0.0079 0.0407
F 1.2400 31.8300 0.5200 104.5100 0.2000
假设是对总体值进行阐述,而不是对样本统计。
置信区间
置信区间
• 使用置信区间我们可以利用样本估算总体的平均值和标准方差 • 置信区间是基于下列要素的取值范围:
– 样本平均值 (X) 和样本标准方差(s) • 置信区间的取值范围会包括:
– 总体平均值 ( ) 及总体标准方差( )。
在风险水平一定的情况下,样本平均值周边的多大范围能将 总体平均值包括在内?
比例 数(样本数N不是常数)
比例分析 Stat>Control Chart>P (np>5)

可计数数据 分析 Stat>Control Chart>U

比例 分析 Stat>Control Chart>P (np>5)
平均值分析:
ANOM是检验总体平均值的 图形检验
Hit Ratio
平均值图形分析
标准偏差 比率的F检验
均方差的同一性
BARTLETT'S TEST.
LEVENE'S TEST.
逻辑变量
可计数数据
将数据转变成连续数据(开平 方根) Stat>ANOVA> 1-Way, 2-Way, or GLM
比例数(样本数N是常数)
比例分析 Stat>ANOVA>Analysis of Means Binomial (np>5)
“Six Sigma”解释的方法:
销售VP问:“在95%置信度下是否有统 计上的差异?”
回答说:“是的,A区销售与总平均值有 统 计上的差异。” VP研 究A区的最佳实践。
统计“能够 ”...
统计“不能” …
• 推论两组数据的平均值是否相同 • 直接说那一个较好
• 推论两组数据的偏差是否相同
• 告诉我们如何解决问题
明公司的担保风险
X 轴估计 Kmart 需求
60.8 60.9 61.0 61.1 Average Watts
置信水平 99% 95% 85% 75%
样本容 259 132
53 23
假设检验: 依据数据进行决策的核心
实际问题 统计问题
“经验”
本能 数据 知识
实际答案 统计答案
1. 所有流程均具有变 动性
Analysis of Variance
Source Sales Person FW Sales Region Experience Customer Type Error Total
DF
Seq SS

3
0.0727
1
4.4798
2
0.0159
17
0.6918
27
9.2276
• 推论两组数据的缺陷率是否相同 • 做出决定
• 确定规范或极限
为什幺需要假设检验?
总体:整个集合的全体特征 样本:具有总体特征的子集
根据样本确定总体!!!
总体参数与样本统计
总 体参 数
样本统计
平均 值
x
标准偏差
s
比例(百分数)
P
p
1. 总体参数(值)是固定的,但不知道。 2. 样本统计是用来估计总体值的。
置信区间
置信限
置信区间....置信限...
真实的总体平均值和标准方差 可以落在置信上限和下限之间
的任何一点!!!
置信下限
置信区间
置信上限 置信限是 置信区间内的最大值和最小值 !
置信度
• 置信度是希望让总体平均值和标准方差落在根据样本计算出的置信区间内的概 率大小!
• 6 西格玛和业内通常使用95%的 置信度,这意味着: –在95%的情况下总体平均值和标准方差落在置信区间内 –在5%的情况下(alpha 风险),总体平均值落在置信区间外。
非参数的检验
平均值的检验 .
标准偏差检验 位 置的检验
离数的检验
常用的假设检验
连续变量
平均值的检验
标准偏差的检验
一个总体
两个总体
三个或以 上总体
一个总体
两个总体
三个或以 上总体
一个样本 的T检验
样本相关
样本不相关
结构图
无结构图
标准偏差的 CHI平方检验
成对T检验 二个样本 的T检验
Tukey的 平均值的分 均方差的分 快速检验 析ANOM 析ANOVA
何时需要假设检验?
如果想分析输入以确定是否影响输出
输入A 输入B 输入C
过程
输出 发票
如果想知道两个不同的过程产生的结果是否相同 如果在“改进”实施前想确认一下。
任何时侯如果想根据样本作客观的判断,就用假设检验!!!
假设检验路线图
数据类型
连续 变量
逻辑变量
数据正态
数据非正态
比例数
可计数数据
正态理论检验
• 如果我希望提高信心 (99% 的置信度).……或者承担更多风险 (75% 的置 信度).……
真实情景下,需要明确愿意承受的风险度…!
置信度 = 承担业务风险的意愿
X轴 LSL
X轴 USL
高风险 < 75%
中等风险 ~ 85%
低风险 > 95%
Kmart LFL Watts 举例
故障几率
1 Watt 的增加 = Kmart 发生1亿美元的成本/照
相关主题