精益六西格玛 测量阶段概述
12
Measure
7
总体和样本
参数的获取途径有两种:通过调查总体获得和通过抽查样品获得。
总体 (N)
具有某种特征的全体 对象或个体的集合。 包括对所有可能的对 象或个体的具体参数 或特征的测量。 总体可能指刚刚出厂 的所有盒装牛奶。
样本 (n)
总体的一个子集。在统计 学中,我们会遇到“随机 抽样”,或一组特选的样 本数据,每一次样本被选 中的几率都相同。
为了能够正确对流程能力进行研究和找出问题所在,需要收集数 据
在正式收集数据之前明确数据收集的目的、制定数据收集的计划 将会使得数据收集更加有效,周期更短。
数据收集计划从以下几方面去考虑:
为什么要收集数据(Why)
需要收集哪些数据(What) 谁去收集数据(Who) 在哪里收集数据(Where) 什么时候去收集数据(When) 怎么样去收集数据(How)
每个方面都有相应的参数指标来衡量
18
分布的形状
有两个指标来衡量分布的形状:
偏斜度(SKEWNESS)
用来衡量数据的对称性。 当一组数据的 平均值大于其中位数时,此组数据就向右 倾斜。 正态分布偏斜度为0(K=0)
平均值大于其中位数右偏,K>0,正偏度
平均值小于其中位数左偏,K<0.负偏度 偏斜度指标的值越小,数据就越对称。
5
项目改善的焦点(问题所在)
我们利用一种叫做分层 (Stratification)的技术 来找出问题所在
40
问题所在
Pareto Chart for Defect
100 80 30
Count
60 20 40 10 20 0
狠
ぃ ire gd on Wr n ctio l ma rn i g te r on W al min ter ak bre er s Oth
22
离散程度的衡量
极差 (Range)
最简单的离散的测量。波动范围仅仅是测量的最大值和最小值的差
Range=Max Min
偏差 (Deviation) 偏差是测量值和从绘制的分布图获得的平均值的差距。 或
x x
x xi
方差 (Variance) 对于总体:方差等于偏差的平方和除以总体中个体总数N 对于样本:方差等于偏差的平方和除以样本量减一 (n-1)
地区
离散型数据不能再被细分
11
连续型数据和离散型数据的比较
在项目中,首先应考虑获取连续型数据,因为连续型数据提供的信息更多, 而需求的数据量更少。 当不能得到连续型数据的时候,就可以利用离散型数据进行分析,但需求 The Advantage of Continuous 的数据量更大。
Data
例如: 今天出售的鞋尺码:
36, 42, 40, 41,43, 39, 40, 41, 40, 37, 38
观察每种尺码出现的数值,可以发现40是模数。
20
集中趋势的衡量
平均值或者均值 (Average or Mean) 一组数据的平均值仅仅是所有数据的几何平均
X
x
i 1
n
i
n
这里 X 代表观察到的变量,xi代表一组数据中的第i个 数据,S代表求和, X 代表所有数据的平均.
14
波动
所有流程都存在波动,没有任何两件产品其质量特征是 完全一样的 我们预期观察值会有差异,如果没有差异,我们就会产 生怀疑。 通常我们不会仅仅依靠一个数据就做出结论,而是收集 多个数据并且非常注意如何收集这些样本,以减少偏差。
波动的产生是很自然的,是意料之中的。波动是统计学的基础
15
子组内流程的波动仅受普 遍原因的影响,它反映了 流程最好的能力即短期能 力。 子组间流程的波动受外来 因素(特殊原因)的影响, 它反映了流程的控制状态 即长期能力。
长期波动
(特殊原因) (Assignable Cause) Between Subgroups 合理子组间
50 40 30 20 10 0 -10 200 400 600 800 1000
峰度(KURTOSIS)
用来衡量分布曲线峰尖或着低平的状况。 正值的指标表示此分布比标准正态分布有 着更尖的峰和更陡的尾巴。 负值的指标表示此分布比标准正态分布有 着更低平的峰和更平缓的尾巴。
19
集中趋势的衡量
模数 (Mode) 模数,又叫众数,是一组数中出现频率最高的数值, 统计学中不常用。
7
数据属性与基本统计学
冠卓 • 精益六西格玛
8
数据的属性
数据来源于对象、情景和现象。 数据被用来分类、描述、改善和控制对象、情景和现象。 有些数据可以用连续的刻度来加以区别;换言之,这种刻度 可以被合理的细分到更准确的增量,因此这种数据被称为连 续型数据。 但我们也可以用记数的方式来获取数据。这种数据不能被合 理的细分,因此被称为离散型数据 。
26
离散程度的衡量
数据跨度 测量样本或者样本总体的数据跨度,常用于象均匀分布这样 不支持其他更精确的离散测量的分布类型 。
四分位数 对于从最小到最大排列的数据系列,四分位数可以帮助细分 离散单元。25%的数据点包含在第一个四分位数前,75%的数 据分布在第三个四分位数前。
引起波动的原因
普遍原因
流程固有的未知因素。就目前 流程所用的技术而言,此类因 素是不可控制的。 此类因素也叫残差或背景噪音。 它限定了流程可达到的最小的 偏差,所以从偏差的角度来看, 普遍原因所造成的偏差代表了 流程的最好水平。 要想控制或改善普遍原因造成 的偏差需要对系统或流程采取 行动。
特殊原因
To Obtain the Same Level of Understanding
cr D is
e te
$
Sparse Information
Continuous
$
Rich With Information
1_03_01_005
Scales of Measure
离散型数据需要更多的数据点才能进行有效的分析
确定项目的问题所在(改善的焦点)
为了达到以上的目的,我们将要回答以下的问题:
我们的数据可靠吗? 流程现状能力如何(长期能力)? 流程的潜在最好能力能满足要求吗(短期能力)? 是管理问题还是技术问题? 改善的目标如何? 是哪些问题引起了大部分缺陷的产生(项目的焦点)?
2
测量阶段的工作流程
在测量阶段,我们将按照以下流程开展工作
2
(x i ) i 1
N
2
N
s
2
(x i x ) i 1
n
2
n 1
23
离散程度的衡量
方差 (Variance) 对于总体:方差等于偏差的平方和 除以总体中个体总数N 2 对于样本:方差等于偏差的平方和 除以样本量 (n-1) 标准差 (Standard deviation) 标准差是方差的开方
显而易见的并可归结为某个指定的 的原因或流程输入的因素。
利用现行的技术可以对此类原因进 行控制。
随着时间的推移,此类因素的作用 会表现在流程输出的波动上。 通常我们把特殊原因归类为5M1E
人员(Manpower) 机器(Machinery) 方法(Method) 测量(Measurement) 物料(Materials) 环境(Environment)
21
集中趋势的衡量
中位数 (Median)
中位数是一组数据中居中的那个数据。如果数据个数为奇数个, 则中位数是数据的中间那个;如果是偶数个,中位数就是中间 两个数据的平均。
例如: 对于数据列 15,17,18,19,22,25,26, 中位数是 “19”。 对于数据列 6,7,8,9,12,17, 中位数是 8.5 (8和9的平 均)。
15
10
5
0 46 47 48 49 50 51 52 53 54
distributions
17
描述数据分布的参数
通常以以下三方面来描述一个分布:
形状 反映分布曲线的形状。分布是就平均值对称的还是偏斜的,是呈尖 峰状的还是平缓的? 位置或者中心趋势 反映了分布的中心或者分布数据的中点。 离散程度 反映了分布数据的变化范围。
对于我们的项目,这关 键的20%问题在哪里?
0
Defect
Count Percent Cum %
27 64.3 64.3
5 11.9 76.2
5 11.9 88.1
3 7.1 95.2
2 4.8 100.0
确定问题所在是测量阶段的工作关键
6
Percent
80%的缺陷会由20%的问 题产生
数据收集计划
制定收集计划 数据分层 柏拉图
精益生产指标
OEE 3
我们的数据可靠吗?
错误的数据将把我们引向错误的方 向
同一个产品,不同的测量人员测量可能会 有不同的结果? 产品品质的判定,是否会出现人员A判断不
合格,而人员B判断合格的情况?
测量系统分析(MSA)可以回答我们数据有多可靠
4
流程能力
合理子组(Rational Subgroup)技术可以帮忙收 集数据和进行流程能力分析
16
数据的分布
数据分布是一个概率分布。它是流程波动的数学模型。 下面的柱状图可以直观反映实际观察的分布概率,称为频率分布。
Histogram of distributions, with Normal Curve
分布曲线和直方图 (process = QCNArro)
25
20
Frequency
项目 批准 制定数据 收集计划 分析测 量系统 收集数据 分析流 程能力 制定改 善目标 数据分层 确定问 题所在 阶段评审