总体标准差的极差估计法自接触SS以来,对于SPC中Xbar图中的Sigma(极差估计法)估计一直都没有看到过较详细的解释&说明.只知其运用在SPC Xbar中sigma的估计,以及它所计算的是组内的变差。
今天偶然遇到一则概念:由极差分布函数求出极差的数学期望值E(R) = d2*sigma;方差值D(R) = (d3*sigma)^2不知哪位前辈&高手可以帮忙深入解说一下,极差估计法的原理。
thomasgao2010-11-10 16:54:26蛮深奥的问题,曾经研究过,现在也忘得差不多了,尝试着解释一下:1。
以正态分布为例,给出一族数据,就可以计算出它的均值和方差。
而从另外一个方面讲任何一个正态分布都是由正态分布函数决定的,只不过函数中的系数取值不同而已。
知道了分布的函数和其中系数的取值,同样可以推导出这个分布的均值和方差。
(正态分布函数是一个两参数(均值和方差)的函数,具体公式自己查一下,我这里不贴了)2。
在最初的SPC中的数据计算是手工的,没有计算机帮助。
对于分布的均值比较容易手工算,但方差就比较复杂了。
后来就有人提出来用极差R来近似方差S。
3。
R的计算方法简单,取每个子组内最大值减去最小值。
假设有n组数据的话就会有n个R。
这n个R本身又构成一个分布叫做极差分布,具体的公式我都忘记了,感兴趣的话自己找资料查一下。
4。
在画R图是,我们需要知道R的均值和方差,这个时候用极差分布的公式来推就比较容易了,就是你贴中的公式。
其中的系数d2/c4 随着子组的大小而变化thomasgao2010-11-11 09:57:50正态分布的公式贴出来nomal distribution.jpg其中x是变量,μ和σ是参数,它们的取值确定了一个具体的分布,所以称为两参数函数。
thomasgao2010-11-11 10:10:37关于极差分布的推导比较复杂,我手边没有资料提供。
一般统计教程里也不包括这部分内容,楼主感兴趣的话,可能需要花点功夫找一些比较高级的统计教材才有可能有。
kelvinzhang2010-11-13 00:58:44关于用样本的极差R来估计总体的标准差, 很久之前就有很多牛人做过研究, 好像在"ASTM Manual on Presentation of Data and Control Chart Analysis (1976) " 著述中有详细说明.上网查了下, 找到了当年Tippett在1925年研究出的d2公式:paladin_li2010-11-16 14:29:12其实最初我想请教:"关于R与d2所评估的标准差,属于组内标准差"是否有此一说,为什么?kelvinzhang2010-11-16 15:47:46你这个问题问得很有意思. 用组内的R除以d2来估计的标准差就是组内标准差. 同理, 用Rbar除以d2估计的标准差就是组间标准差.其实你关心的SPC中的Xbar图就是这么画出来的: 先算出每一个组内的R和Xbar, 再算出Rbar和Xbarbar, 查表知道d2, 可以算出组间标准差sigma. 用Xbarbar 加减3*sigma/sqrt(n)就能算出上下控制限.所以回答你的问题: 在SPC中的Xbar图中的标准差其实是用Rbar估计出来的, 应该叫组间标准差.paladin_li2010-11-16 16:45:22前辈可否帮忙深入解释一下: R/d2,Rbar/d2估计组内/组间sigma的基本原理!感谢!!2010-11-16 16-40-49.jpgkelvinzhang2010-11-16 17:51:45不太确信你说的基本原理是什么意思. 简单说, 总体的sigma需要用样本的统计量进行估计. 而R/d2就是其中的一个无偏估计. 由于R只反映最大和最小两个数据的差异, 而sigma需要反映所有数据的离散程度. 所以就用d2作为系数进行修偏.paladin_li2010-11-16 20:33:19单个样本组内标准差的估计(R/d2)公式,理解不是很困难。
但是又该如何理解Rbar/d2对组间标准差的估计?比如说,依据R/d2对标准偏差的估计公式,是否可将Xbar组成的组间样本的标准也用R(Xbar的极差)/d2’进行估计呢,即Rbar/d2 = R(Xbar)/d2'是否成立?? kelvinzhang2010-11-18 16:54:27你说的R(Xbar)/d2'其实是对Xbar这个总体的标准差的估计,而Rbar/d2是对X这个总体的标准差的估计。
所以两者之间差了根号N倍,也就是Rbar/d2=R(Xbar)/d2'*sqrt(N)。
jeccy2010-11-18 20:20:49R 代表的是组内变异,Rbar是R组内变异的平均值,所以代表的也是组内变异而d2是系数所以由Rbar/d2估计的标准差就只包含组内变异。
而由Stdev(所有测量结果)计算的标准差, 由于计算过程是每个测量结果跟平均值的差值,并未考虑是组内还是组间,因此会考虑到所有的变异,即同时包含组内和组间变异。
~~不知回答是不是楼主想要的:)paladin_li2010-11-18 20:30:56R是离散程度的一类指标,d2是随样本变换的修偏系数。
R/d2可以作为总体标准差的估计。
即为组内标准差;作为SPC Xbar中的标准差,即所谓的组间标准差(来自同一总体的样本均值分布)为sigma总体/sqrt(n)(中心极限定理);同样该标准差(均值分布)也可以用R(Xbar)/d'进行估计。
而对于Rbar/d2,我认为是仍然是组内标准差的估计。
Rbar只是多组样本的R’的平均值,以此作为总体的偏离参数。
(但是不知为何不以总体的MAX-MIN差为估计??) 以上不知是否正确,请前辈指正!!在控制图中Xbar图的标准差是通过总体标准差计算而得的,为何选择Xbar图,而放弃X(实际观测值)图?除了均值分布有较强的(中心极限定理)正态性外,不知是否还有其他原由。
还向前辈请教。
jeccy2010-11-18 20:45:03回复15# paladin_li其实不管是Xbar还是X,在使用控制图时都是使用的0.9973的概率。
只是每次抽1个样本时其代表性够不够,不够就要抽多个,抽多个后根据中央极限定理,这多个样本的均值的分布的均值会等于个体分布的均值。
jeccy2010-11-18 20:51:27回复15# paladin_li以前有试过用以下三种方式计算sigma(Xbar),进而计算控制限,结果还是相差很大的。
1.sigma(Xbar)= sigma总体/sqrt(n)(中心极限定理);2.用Rbar/d2代替1中的sigma总体3.先求出每次的Xbar,再求sigma(Xbar)paladin_li2010-11-24 22:39:12关于组内、组间,以及组内/组间标准差的问题再次请教.今天在做教育训练时,发现教材中有这样一条定义:总变异=组内变异+组间变异。
请教:如何理解组间变量的概念,以及其计算公式?(由Xbar新数据列形成的总变异-由原子组估计的随机变异{Rbar/(d2*n)};如何理解组内/组间标准差与整体标准差的差异?(组间/组内(B/W) 标准差是子组间和子组内的平方标准差之和的平方根).2010-11-24 22-37-05.jpg2010-11-24 22-37-31.jpg2010-11-24 22-38-25.jpgpaladin_li2010-11-24 22:42:32 Update excel picture2010-11-24 22-40-41.jpgpaladin_li2010-11-26 12:34:24不好意思,可能没有描述清楚:请教Minitab中,关于组间/组内能力分析标准差的问题如下请教:1. 组内/组间标准差与总体标准差之间的差异,Minitab分析图代表了什么?2. 组间标准差的计算原理是什么?如下是Minitab计算公式,即概念描述:*******************************************************sBetween: Is the standard deviation between subgroups, or an estimate of the variation between subgroups (for example, subgroups collected at set intervals, batches, or by different operators.)sBetween = Max [ 0, SQRT (s2Xbar - (s2Within / Batch size))]s2Xbar is estimated using one of the following methods:1 Average of moving range:Rbar / d2(w) is an unbiased estimate of sXbarwhere:Ri = The ith moving range = Max[xi,..., xi-w+1] - Min [xi,..., xi-w+1], for i = w,..., nRbar = (Rw + ... + Rn) / (n - w + 1)w = The number of observations used in the moving range. The default is w = 2.d2(w) = The unbiasing constants read from a tablesB / W: Is the between/within standard deviation, combining within and between variation and is given by,sB / W = SQRT (s2Between + s2Within)**************************************************2010-11-26 10-31-18.jpgthomasgao2010-11-26 16:35:49回复20# paladin_li谢谢Paladin_li 把Minitab的公式贴出来,这样更方便讨论1。
在Minitab 里关于单参数连续性数据能力分析有三个选项:正态,非正态,还有一个就是你所问的组间/组内。
正态和非正态的方法都比较容易理解。
也就是说数据是正态时用正态方法:数据是非正态,但知道它的分布的时候,用非正态方法。