当前位置:文档之家› 正态总体样本标准差

正态总体样本标准差

正态总体样本标准差S 不是总体标准差σ的无偏估计量设12,,,n X X X ⋅⋅⋅是来自正态总体2(,)N μσ的一个样本,11ni i X X n==∑为样本均值,2211()1nii S X X n ==--∑为样本方差。

众所周知,对任何总体来说样本方差2S 是总体方差2σ的无偏估计两,正态总体更不是例外。

但样本标准差S 却不是总体标准差σ的无偏估计量。

证明: 由于222(1)~(1)n Sn χσ--,若令22(1)n SY σ-=,则2~(1)Y n χ-的概率密度为11()2211022()200n n n y y e y P y y --Γ-⎧->⎪=⎨⎪≤⎩从而112222122()112()11()2()2()222nyny n nnE y dy y e dy yedy n n n+∞+∞+∞------∞===--ΓΓΓ⎰⎰⎰①()21()2n n =-Γ 另一方面,)()E E E S σσ==,所以有1()2n E S E C σσ===≠,所以,样本标准差S 却不是总体标准差σ的无偏估计量。

如果进行修正,则可以得到σ的无偏估计量 nC S σ=,其中2n C =评注:1. 理论依据:正态总体样本的抽样分布,2χ分布与Γ分布的有关性质。

2. 应用与推广:无论总体X 服从什么分布,修正的样本方差2211()1nii S XX n ==--∑是总体方差()D X 的无偏估计量,但是样本方差S 不是总体标准差()X σ=的无偏估计量。

只有在正态总体的情况下才有确定性的修正方法,使得nC S σ= 是总体标准差的无偏估计量,对于非正态总体,情况极为复杂,一般不对其进行讨论。

参考文献:茆诗松等,概率论与数理统计。

本经:中国统计出版社,2000参数估计方法在捕鱼问题中的应用设湖中有鱼N 条,做上记号后放回湖中(记号不消失),一段时间后让湖中的鱼(做上记号的和没做记号的)混合均匀,再从湖中捕出鱼数s 条()s r ≥ ,其中有t 条(0)t r ≤≤标有记号。

试根据这些信息,估计湖中鱼数的N 值。

(1)根据概率的统计定义:湖中有记号的鱼的比例应是r N(概率),而在捕出的s条中有记号的鱼为t 条,有记号的鱼的比例是t s(频率)。

设想捕鱼是完全随机的,每条鱼被捕的机会都相等,于是根据用频率来近似概率的道理,便有r t Ns= 即 rs N t=故 rs Nt≈(取最接近的整数)。

(2)用矩估计法:设捕出的s 条鱼中,标有记号的鱼为ξ,因为ξ是超几何分布,而超几何分布的数学期望是()rs E Nξ=。

捕s 条鱼得到有标记的鱼的总体平均数,而现在只捕一次,出现t 条有标记的鱼,故由矩估计法,令总体一阶原点矩等于样本一阶原点矩,即rst N =,于是也得 rs N t≈(取最接近的整数)。

(3)根据二项分布与极大似然估计:若再加上一点条件,及假定捕出的鱼数s 与湖中的鱼数N 的比很小,即s N,这样的假定对实际来说一般是可以满足的,这样我们可以认为每捕一条鱼出现有标记的概率为r p N=,且认为在s 次捕鱼(每次捕一条)中p 不变。

把捕s 条鱼近似地看做s 重贝努力实验,于是,根据二项分布,s 条鱼有t 条有标记的,就相当于s 次试验中有t 次成功。

故1()(1)()(1)()tts ttts tt t s ts s s s sr r p t C p p C C r N r NNN---=-=-=-同样地,我们取使N 概率()s p t 达到最大,为此我们将N 作为非负实数看待,求()s p t 关于的N 最大值。

为方便,求 ln ()s p t 关于N 的最大值。

于是ln ()()ln ()ln ln ln ()ln()0ts s s d p t s s t p t s N C t r s t N r dNNN r-=-+++--=-+=-令ln ()()0s d p t s s t dNNN r-=-+=-同样可得 rs Nt≈(取最接近的整数)。

(4)根据超几何体分布鱼最大似然估计法:设捕出的s 条鱼中,标有记号放入鱼为ξ,则 ξ是一个随机变量,显然ξ只能取{}0,1,2,(min ,)l l s r ⋯=。

令先考虑s 条中有i 条有标记的鱼的概率,即()p i ξ=。

因湖中鱼数设为N 条,捕出s 条,故{}(),0,1,2(m in ,)is ir N rs NC C p i i l l s r C ξ--===⋯,=因为捕出s 条出现t 条有标记的鱼的概率为()()ts tr N rsN C C p t L N Cξ--==≡根据最大似然估计法,今捕s 条出现有标记的鱼t 条,那么参数N 应该使得()()p t L N ξ==达到最大,即参数N 的估计值N 使得()m ax ()NL NL N = 由比值111111()!(1)!()()!()!!(1)!()!(1)!(1)!()!()!(1)!t s tss sr N rN N N s t s t s s t Nr N r N N rN r N C C C C C L N s t N r s t s N s R N N N r L N CC C C C s N s s t N r s t -----------------+--====--------+22()()()N r N s N N r N s rs N N r s t N N r N s N t----+==--+--+看出,当rs N t <时,()1R N <,这表明如果0rs t t>>,N 时,()L N 是N 的下降函数;当rs N t >时,R ()1N >,这表明0,rs t N t><时,()L N 是N 的上升函数。

于是rs N t=时,()L N 达到最大值,但由于N 时整数,故取 rs Nt≈(取最接近的整数)如果0t =,就加大s ;若仍有0t =,可认为 N=+∞。

评注:1. 理论依据:二项分布、超几何体分布的概率计算,矩法计与极大似然估计。

应用参数估计的思想和方法分析、处理问题。

2. 应用与推广:此例说明,对同一个问题可以采用不同的方法解决。

例如,估计一个城市的人口总素,也可以采用同样的方法去考虑。

参考文献:孙荣恒⋅趣味随机问题⋅北京:科学出版社,2004平均值的质量控制图在工业质量控制中,常需要每隔一定的时间就检验一次同样的假设0H 。

例如,在制造某种弹簧的过程中,需要控制弹簧的自由长度具有平均值 1.5μ=厘米。

设弹簧的自由长度(总体)服从正态分布,且标准差0.02σ=,为检验生产过程是否正常,每隔一定时间(例如一小时)取样n 件,根据抽测的自由长度的平均值x 来检验假设0: 1.5H μ=(厘米)。

为简化这项工作即便于了解生产过程中统计规律性,制作了如下的图表。

图中的纵坐标是x 的大小,中心线在 1.5μ=,控制上限和控制下限分别在00μμ+-,每个样本平均值都画在图上,用黑点表示。

如果x 都落在控制线之间,则表明生产过程处于正常的控制之下;否则,就要检查原因,适当地调整机器,显著性水平σ不超过0.003。

图中的控制限中的3就是取0.0027σ=得到的。

这是根据3σ规则得到的检验方法。

如果总体2~(,)X N μσ,则 {}32(3)120.9986510.9973P X μσ-<=Φ-=⨯-=在X 中抽取容量为n 的样本12,,,nX X X ⋅⋅⋅,则样本均值2~(,),~(0,1)X X N N nσμμ-。

当总体方差2σ已知时,在显著性水平0.027σ=之下,假设00:H μμ=的接受域是:33X μ--≤≤。

那么,如果以X为检验统计量的接受域为:003Xμμ-≤≤+。

所以,做出的控制图分别以00μμ-+作为控制下限和控制上限。

如果每隔一小时的时间间隔内采样(容量为5)的样本均值如下:1.510,1.495,1.521,1.505,1.524,1.488,1.465,1.529,1.520,1.4441.531,1.502,1.490,1.531,1.475,1.478,1.522,1.491,1.491,1.482由0 1.50.02μσ==及作出样本容量5n =的样本平均值控制图,可以作出质量控制图。

评注:1.理论依据:正态总体均值的置信区间,根据样本构造置信上限与下限,从而作出质量控制图。

2.应用于推广:根据正态总体分布与数理统计的知识,进行质量管理与质量控制是概率统计应用的一个和重要的方面,特别是用在质量控制的法则,目前在全球最先进的企业都采用管理法,已经形成一种企业管理文化。

而正态总体参数。

相关主题