当前位置:文档之家› 6_Sigma涉及的统计学基本概念共42页文档

6_Sigma涉及的统计学基本概念共42页文档

62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 73
x=
1
n
,
在这里X1是样本的第一个点,
Xn是样本的最后一个点。
.
举例:给定一个样本:{1,3,5,4,7 },平均值就是:
x = (1+3+5+4+7) = 20 = 4.0
5
5
样本的平均值等于4。
统计学术语和定义
标准差 本。
-衡量^数据分散程度的一个指标。一般用表示总体,用s 或 表示样
=
N
( X i - )2
连续数据 (也称为可变数据)
连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的 特性。测量标准可以有意义地不断分割,使精确度提高。
你能举出我们用来获得连续数据 的三个器具例子吗?
相对于仅仅知道部件是否合格而言, 连续数据可以提供更多的信息。
离散数据
(也包括属性或类别数据) 离散数据是某件事发生或未发生的次数,以发生的频数来表示。 离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。


统计学术语
• 总体 - 全组数据,全部对象。 - 一个总体中的元素数量用N来表示
• 样本 -总体的一个子集 - 样本的元素数量用n 来表示
• 平均值 - 总体或样本的平均值 - 总体的平均值用来表示
- 样本的平均值用X 或^来表示
• 方差 - 数据与其平均值之间差值的平方的平均值 。(它代表该组数据的分散程 度)
1. 系统波动
预期的和可预测的测量结果之间的差异。 举例: 夏季和圣诞节假日的电灶销售量不同。
2. 随机波动
不可预测的测量结果之间的差异。 举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用 同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的 结果。
i
xi
(xi-4) (xi-4)2
1
2
-2
4
2
6
2
4
3
4
0
0

12
0
8
方差 (s2) = 8 / (3 - 1) = 4
标准差 (s) = sqrt(4) = 2
课堂练习
计算平均值、方差和标准差
n
x=
xi
1
n
均值
s2 = 方差
n
( X i - X )2
i=1
s=
n-1
标准差
n
( X i - X )2
举例 - 2019年5月在深圳生产的一百二十台十六立方英尺冰箱
举例:
XXXXX XXXXX XXXXX XXXXX XXXXX
这个矩阵代表25个X的总体。画上圆圈的 那些是由总体中的六个X组成的样本。
统计学术语和定义
平均值 - 总体或样本的平均值。
用x或^来表示样本,用来表示总体。
n
xi
平均值的公式
离散数据需要更多的数据点才能进行有效的分析
应用你所学到的东西
请在下面的例子旁,写出它是“连续”还是“离散”
1 销售订单准确度 2 数据输入准确度 3 销售地区 4 使用“合格/不合格”测量仪器得到的孔径 5 孔径 6 应答中心对话时间 7 制冷氟利昂的重量(克) 8 每百万部件中有缺陷部件的数量 9 装配线缺陷(ALD)
波动的产生是很自然的,意料之中的,是统计学的基础
统计学用以下方法处理误差:
统计学的作用
统计描述 统计推理
试验设计
用图表和几个总结性数字(均值、方差、标准差)描 述一组数据。
确定结果之间的差异何时可能是由于随机误差引起 的,何时不能归因于随机误差。
(置信区间和假设检验)。 收集并分析数据,以估算过程变化的 影响。
烟火探测器
离散数据不能更进一步精确地细分。
离散数据
离散数据举例:
有凹痕的部件数量
通过/未通过
申诉决议
产出
生产线不合格品数量
及时交货
连续数据与离散数据进行比较的解释: • 一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获
得更多的信息。
• 如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出 判断。.
统计概念
目的:
复习基本的统计学概念。
目标: 解释以下基本统计概念。 1. 波动(偏差) 2. 连续数据和离散数据 3. 平均值、方差、标准差 4. 正态曲线 5. 用Z值将数据标准化 6. 中心极限定理 7. 过程能力
- 使用Z值作为衡量工序能力的指标 - 通过改进关键值Xs来改进Y
观测值变化
当重复进行测量的时候,通常会得到不同的答案, 这就是波动!
i=1
N
总体的公式
S= =
n
( X i - X )2
i =1
n-1
样本的公式
方差 - 与平均值之差的平方的平均值。一般用s2或2来表示。
^
举例
计算平均值、方差和标准差
x=
n
x i
i=1
n
平均值
s2 = 方差
n
( X i - X )2
i=1
s=
n-1
标准差
n
( X i - X )2
i=1
n-1
课堂举例: 计算样本{2, 6, 4 }的方差和标准差 首先计算均值: (2 + 6 + 4) / 3 = 12 / 3 = 4
- 总体的方差用 表示
- 样本的方差用s2或^表示
• 均方差是方差的 (正) 平方根。 (它也代表该组数据的分散程度)。
-总体的标准差用 来表示
-样本的标准差用s或^来表示
统计学术语和定义
总体 - 全部对象.
举例 – 2019年5月在深圳生产的所有的16立方英尺冰箱
样本 -代表总体的一个子集数据。
观测值变化(续)
我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。
如果所有地区的电灶销售量是一样的,那么我们就会怀疑是数据库出了 问题。.
如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测 量是否正确。
这种变化使我们的工作更具挑战性! 一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而 且非常注意如何选取这些样本,以减少偏差。
数据的两种类型
解决办法
连续数据
离散数据
问题
• 连续 (可变) 数据 使用一种度量单位,比如英寸或小时。
• 离散 (属性) 数据是类别信息,比如““ 通过” 或““ 未通过”。
举例:
部件号
1 2 3 4 5
离散 通过 通过 未通过 通过 未通过
连续
2.031 2.034 2.076 2.022 2.001
i=1
n-1
课堂举例: 计算样本{1,3,5,4,7 }的方差和标准差
(使用下面的表作为向导。)
首先计算平均值X:
i
xi
xi - x
(xi - x)2
1
2
3
4
5
T o ta ls
方差 (s2) =
标准差
(s 或 )
^
=
频数
90位女士的身高
15 10 5 0
60
绘制直方图
59 61 63 63 64 59
相关主题