当前位置:文档之家› SPC-基本统计

SPC-基本统计


Median 中值
练习五 (a)假设一个样本观测值为 : (b) 3 1 2 4 7 8 6 样本均值和样本中值是多少? 这2个值是测量数据中心趋势的合理指标吗?
2020/11/16
Median 中值
(b) 假如最后一个数值改变为 : 3 1 2 4 7 8 2680
则样本平均值和样本中值是多少? 据此你有何结论?
2020/11/16
Mean 均值
练习三 10个连接线的拉拔强度为 :
260 230 240 236 248 248 252 278 265 262
249拉拔强度的均值是多少?
25010个观测值的均值为:
x
n xi
i 1
260
230
240 ...262
n
10
2020/11/16
Mean 均值
Population 总体 ➢已制造或将要制造对象的全体集合,用所关注的特性描述
➢我们究竟能否知道真正的整体参数?
Sample 样本 ➢ 统计研究中实际测量的目标组
➢ 样本通常是整体的子集
Σ=整体标准差
Population 整体
sample 样本
S=样本标准差
2020/11/16
描述计量型数据集
“报告上司:河水深度1.6M, 士兵平均高度1.7M, 过河没有问题”,但是..
至于我们不能只看平均值, 还需要利用其他统计量来分析……
2020/11/16
描述计量型数据集
一组计量型数据能显示以下3个特性: Central Tendency (Mean, Median, Mode) 中央趋势 (均值, 中值, 众数) Variable (range, Standard Deviation, Variance ) 变异(全距, 标准差, 方差) Shape 形状
分布叫什么?(单峰分布…)
2020/11/16
Mode 众数
为何使用众数? 当观测值为分类式(如名义数据, 序列数据)时.众数是描 述数据位置的最好的指标. 典型的例子是,一个公司内员工收入的众数
众数的重要信息 当众数不止1个时,从中抽取样本的总体通常是多个总体
的混合
2020/11/16
均值、中值、众数的比较
2020/11/16
答案
数据类型 (V or A)
1) 顾客平均消费,电话待机时间
v
2) 产品是否合格
A
3) 职员- Tom, Nancy, Howard.
A
4)
4) 支出与预算相符
A
5) 输入支出费用的时间
v
2020/11/16
小组讨论(练习二)
计量型数据
计量型数据的益处 ? 计量型数据的缺点 ?
2020/11/16
Quartiles 四分值
练习七
以下为20个电灯泡失效期间的观测值, 已按递增顺序排列.
210 216 252 300 366 454 624 720 816 924 1216 1296 1392 1488 1542 2480 2856 3192 3528 3710
请确定三个四分值.
样本中值
假如x (1),x (2) ,…,x (n) )是按大小排序的样本值,则样本中值 为:
x([n 1] / 2)
if n is odd n为奇数
Me
x(n
/
2)
x ([ n
/
2]
1)
if
n is even n为偶数
2
中值的优点是不受极端大或极端小的观测值的影响。
2020/11/16
2,2,2,2,2,2,90 可以用一半一半准则吗?
2020/11/16
Mode 众数
众数是样本中出现次数最多的观测值。 众数可以是唯一的,也可以有不止一个,有
时并不存在众数。
2020/11/16
Mode 众数
练习六 如果样本观测值为: (a) 6 9 13 5 8 13 4 6 13 1 10 13 (b) 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 (c) 4 3 7 2 6 8 1 (d)众数是什么? (e) 具有一个众数,两个众数或多于两个众数分布的数据
2020/11/16
Quartiles 四分值
2020/11/16
散布的测量(变异)
Range Variance Standard Deviation Inter-Quartile Range
极差 方差 标准差 四分植极差
2020/11/16
Range 极差
样本极差为样本中最大和最小观测值之间的差别,即:
2020/11/16
转化计数型数据
如可以,将计数型数据转换为计 量型数据能增加它的功能。
计数型数据
转 换 为
计量型数据
2020/11/16
Variable Data 计量型数据
2020/11/16
计量型数据 – 学习目的
完成此阶段学习后, 学员能够 Ⅰ 利用数据的分布形状,中央趋势和变异大小进行特性化
x
正态分布
21
x MO Me
偏上分布
x MO = Me =
x MO ≤ Me ≤
12
x Me MO
偏下分布
x MO ≥ Me ≥
2020/11/16
Quartiles 四分值
将一组按大小顺序排列的数据平均分为四部分,分界点 即四分值. ➢ 第一四分值(低四分值),约25%的观测值小于它. ➢第二四分值,约50%的观测值小于它, 即中值. ➢第三四分值(高分值),约75%的观测值小于它.
30 50 70 90 110 130
2020/11/16
方差计算
s2
n ( xi x)2
i 1
n 1
i
xi
xi-x
(xi-x)2
1
30
-50
2500
2
50
-30
900
3
70
-10
100
4
90
10
100
5
110
30
900
6
130
50
2500
xi 480
(xi x) 0 (xi x)2 7000
r =xmax - xmin
极差是测量数据散布或变异的最简单的方法 但它忽略了最大和最小值之间的所有信息
2020/11/16
Range 极差
试考虑以下的2个样本: { 10 20 50 60 70 90 } and { 10, 40, 40, 40, 90}
具有相同的极差(r= 80) 但是,第二个样本的变异只是2个极端数值的变异,而在第1 个样本,中间的数值也有相当大的变异. 当样本量较小(n≤10)时,极差丢失信息的问题不是很严重
Mode 众数
Quartiles 四分值
2020/本量为n)的观测值为x1,x2,…xn,则样本均值 x
为:
x x1 x2 ... xn
n xi
i 1
n
n
➢ 类似地,一个有着大量但限个(N个)观测值的总体,
其总体均值 为:
N xi
i 1
N
益处 : 1. 容易得到数据,并且计算方法简单 2. 数据容易理解 3. 数据随时可得 缺点 : 1.无法显示缺陷怎样发生及过程如何变化 2.不适合低缺陷率(需要大量的抽样) 3.不能预测发展趋势和情况
2020/11/16
数据类型比较
计量型数据 连续数据 通常为正态分布 实际数值 实际定义严谨 需少量抽样
2020/11/16
计数型数据 计数数据 通常为二项式分布或泊松分布 合格/不合格 数据定义较差 需大量抽样
知识水平
1. 没有数据,也没有经验 – 只有观点 2. 没有数据 – 只有经验 3. 收集了数据 - 但只是看数字有多少 4. 分组的数据 - 图表 5. 描述性统计数据 – 中数、标准差等等 6. 推理性统计 – 预测过程绩效:能力分析,回归和 实验计划法
2020/11/16
方差与标准差
若x1, x2, …,xn 是一个具有N个观测值的样本,则样本方
差为:
s2
n ( xi x)2
i 1
n 1
样本标准差是样本方差的算术平方根,即:
n (xi x)2
s
i 1
n 1
2020/11/16
方差计算
s2
n (xi x)2
i 1
n 1
练习八: 计算下列观测值的方差和标准差.
2020/11/16
参数和统计量符号
Mean 均值
总体(参数) 样本(统计量)
μх
Variance 方差
σ s2
σ Standard Deviation标准差
s
Proportion 比例
π
p
2020/11/16
位置测量
( Central Tendency )中心趋势
Mean
均值
Median 中值
练习四 199X年一个行动中,战机进行了3000次战斗,总共
用时6900小时。那末每次战斗平均用时多少?
每次战斗平均用时为:
注意所使用的符号
N i 1
xi
6900
2.3hours
N 3000
2020/11/16
均值的特性
均值的计算使用了每个观测值;每个 观测值对均值都有影响。
所有观测值对均值的偏差的总和为零。 均值对极端的观测值很敏感,极端值 △6
会导致均值向他偏移。
△4 △2
2020/11/16
X x x x xx x 6 3 5 1 27 4
相关主题