当前位置：文档之家› 六西格玛数据分析技术4

六西格玛数据分析技术4

六西格玛数据分析技术4
2020年7月13日星期一
σ
σ σ σ σ σ σ σ σ

返回目录
第4章参数估计
4.1 参数估计的基本概念 4.2 总体均值和总体比例的区间估计 4.3 样本容量的确定 4.4 两总体均值之差的区间估计 4.5 两总体比例之差的区间估计 4.6 正态总体方差的区间估计 4.7 两个正态总体方差比的区间估计 4.8 有关区间估计的Minitab软件实现
矩估计法(续)
解：因为μ是全体灯泡的平均寿命，为样本的平均寿命，很自想到用去估计μ；同理用s去估计σ。
由于
例4－2.设样本x1,x2,…, xn来自参数为λ 的泊松分布。由于 E(X)=D(X)=λ，因而与s2都可以作为λ的矩估计值。
由例4－2可以看出E(X)=D(X)=λ，这表明总体均值与方差相
在进行区间估计时，必须同时考虑置信概率与置两个方面。即置信概率定的越大，则置信区间相应。这两者要结合考虑，才更为实际。
14
返回目录
4.2 总体均值和总体比例的区间
总体均值的区间估计
➢当X～N(μ,σ2)时， x1,x2,…, xn是来自该正态总体的随
，
。
➢ 当总体方差σ2已知时，μ的1-α置信区间为：
解：样本x1, x2,…, xn的联合密度
用均值
来表示，就有：
，将看作常数， λ看作变量，可得似，进而取对数，求微商，解方程可得：对本例而言，就有：
10
返回目录
点估计的优良性准则
不同的参数估计方法，可得到不同的估计量，不同的估谁优谁劣？我们有一些相应的评价准则。在6σ管理中，用的点估计优良性准则有两个：一个是无偏性，另一个
➢3.必要样本容量n与正态分布Z1-α/2分位数(也称可数)成正比。即：我们要求的可靠程度越高，样本
就应越大；如果要求的可靠程度越低，样本容量
以小些。
24
返回目录
样本容量的确定(续3)
例4－8.某广告公司想估计某类商场去年所花的广告费平均有多少。经验表明，总体方差约为1800000。如置信度取 95%，并要使估计值处在总体平均值附近500元的范围内，这家广告公司应取多大的样本？
个数值区间估计包含了两个数值，对应着数轴上的一个区
，所以称为区间估计点估计的方法最常用的有两种：
•矩估计法 •极大似然估计法对一个估计优良性的评价有一些相应的评价准则
4
返回目录
矩估计法
对总体参数的估计，人们最容易想到的方法就是矩估即用样本矩估计总体相应的矩，用样本矩的函数估计应矩的函数。
差为σ2，只要n＞1，作为μ的估计值，比x1就更有效。
12
返回目录
区间估计
点估计没有给出估计的精度和可靠程度，区间解决了这一问题。
设θ是总体的一个待估参数，从总体中获得容量的样本是x1, x2,…, xn，对给定的α(0<α<1)，有统： θL=θL(x1, x2,…, xn) 与θU=θU(x1, x2,…, xn) 若对任意θ有P(θL≤θ≤θU )＝1-α,则称随机区间 ]是θ的置信水平为1-α的置信区间。 θL 与θU分别称为1-α的置信下限与置信上限，显著性水平。
小组讨论与练习
2
返回目录
本章目标
1.掌握参数估计的基本概念 2.建立起在管理中运用参数估计的思想 3.能运用Minitab实现各种区间估计的计算 4.掌握样本容量的确定方法 5.能在管理实践中运用参数估计方法
3
返回目录
4.1 参数估计的基本概念
参数估计有两大类，一种叫点估计，一种叫区间估点估计是利用样本的信息对所感兴趣的参数估计出
➢ 解：已知X～N(μ,0.152)时， =2.14，n=9,1-α=0.95, α=0.0 标准正态分布表可得1-α/2的分位数，Z1-α/2=1.96；α=0.0 Z1-α/2=2.58； α=0.10时， Z1-α/2=1.64。这是一些常用值，记住。
➢ 我们可以95%的概率保证这种零件的平均长度在(21.302 之间。
17
返回目录
例4－5.σ2未知时，μ的区间估计
为了估计各省市电视台在某黄金时间一分钟广告的平均随机调查了20个电视台，他们每分钟的广告费 =25000 s=8000元。假定所有电视台的广告费近似遵从正态分布总体均值95%的区间估计。
➢ 解：这是总体方差σ2未知的情况。已知 =25000，s=800 n=20， α=0.05，则t1-α/2(n-1)= t0.975(19)=2.093；于是
让10个人挑选10支不同颜色的铅笔，只有9人有自由挑能，因为当这9人都挑好之后，你别无选择！因此这个自由度为9。
自由度可以理解为在研究问题中，可以自由取值的数据。
16
返回目录
例4－4.σ2已知时，μ的区间估计
某种零件的长度遵从正态分布，从该批零件中随机抽取测得其平均长度为21.4mm。已知总体标准差σ=0.15mm，立该种零件平均长度的置信区间，给定的置信水平为0.
可以证明：若x1, x2,…, xn来自正态总体N(μ,σ2)，则：
9
返回目录
极大似然估计(续3)
例4-3.设某种品牌的电视机的首次故障时间遵从指数分布f(t)=λe 测试了7台电视机，获得相应的首次故障时间（单位：万小时） 1.49，3.65，0.26，4.25，5.43，6.97，8.09 求参数的λ估计值。
解之得：只要我们知道了Z1-α/2，σ和允许误差，就可具体
本容量n。如果算出的n不是整数，就去超过该小数的最接
数即可。
23
返回目录
样本容量的确定(续2)
由样本容量的确定公式量之间的一些关系：
，你可发现
➢1.总体方差越大，必要的样本容量n越大。
➢2.必要样本容量n反比例于允许误差B。即在给定水平下，允许误差越大，样本容量就可以越小；误差越小，样本容量就必须加大。
矩是指以期望值为基础而定义的数字特征，例如均值、协方差等。
最常用的矩估计有：用样本均值估计总体均值，用样差估计总体标准差。
例4－1.已知某种灯泡的寿命 X～N(μ,σ2)，其中μ,σ2 ，今随机抽取4只灯泡，测得寿命(单位：小时)为150 1453，1367，1650。试估计μ,σ。
5
返回目录
在实际问题中与s2不见得一样，因而矩估计的结果不惟一。
6
返回目录
极大似然估计
极大似然估计是利用总体的分布密度或概率分布的表达式样本所提供的信息建立求未知参数估计量的一种方法。
极大似然估计好多初学者觉得难以理解，我们用下面的说助理解：在产品检验中，有说这批产品的次品率可能是 1/10000，也有说次品率可能是1/100。如果你在这批产品中随机抽取一件，竟然就是次品，自然应当认为这批产品的次品率最有可能是1/100而不是1/10000。把这种考虑问题的方法一般化，就概括出极大似然估计方法。
例4-6.某航空公司在过去飞行记录中，随机抽取了航班，航班空位数的样本均值 =11.6，标准差=4.1 求过去一年所有航班的平均空位数的置信区间。(α
➢解：所有航班空位数的分布未知，且总体标准差未
但n=225，因而仍可用
做区间估计。
具体数据得[11.15，12.05]，也即该公司有90%的把
过去的一年该公司的平均空位数在11.15到12.05之间
➢ 解：已知σ2=1800000，α=0.05，Z1-α/2=1.96，B=500
➢ 即这家广告公司应抽取28个商场作样本。
25
返回目录
样本容量的确定(续4)
估计总体比例时，样本容量n的计算公式是：
例4－9.某市场调查公司想估计某地区有数码相机的占的比例。该公司希望对p的估计误差不超过0.05，要可靠度为95%，应取多大的样本？没有可利用的估
20
返回目录
总体比例置信区间估计的例子
例4－7.某企业在一项关于职工流动原因的研究中，从该前职工的总体中随机抽选了200人组成一个样本。访问结有140人说他的离开是由于企业管理缺乏人性化。试对由种原因而离开企业的人员的真正比例进行估计(α=0.05)。
➢ 解：已知n=200， =0.7， =140>5，
13
返回目录
区间估计(续)
置信区间的大小表达了区间估计的精确性，置信达了区间估计的可靠性， 1-α是区间估计的可靠概而显著性水平α表达了区间估计的不可靠的概率。
如果[θL ,θU ]是置信水平为0.95的置信区间，由于间[θL ,θU ]会随样本观察值的不同而不同，它有时包参数θ ，有时没有包含θ ，但是用这种方法作参数间估计时，100次中大约有95个区间能包含着参数约有5个区间没能包含θ 。
其中Z1-α/2是标准正态分布的1-α/2分位数。 ➢ 当总体方差σ2未知时，σ用其s代替，用t分布，μ的1
区间为：
其中t1-α/2(n－1) 表示是自由度为n－1的t分布的 1-α/2分
15
返回目录
关于自由度
在统计推断中常常会碰到自由度这一概念，不少人对这一概念不好理解。
如果我们有10个数，而且你知道了均值和其中的9个数那么你就可以推出第10个数。
合概率密度函数。
8
返回目录
极大似然估计 (续2)
一般情况下，我们用求解似然方程的方法进行极大似然具体步骤是： 1.由总体分布导出样本的联合概率密度； 2.把样本联合概率密度中自变量x1, x2,…, xn看成已知，而把参数看作变量，得到似然函数； 3.用微分原理求似然函数的最大值点； 4.在最大值点的表达式中，代入样本值就得参数的估计
性。
无偏性：设是参数θ的一个估计量，如果是参数θ的无偏估计。
，则
➢ 无偏性实际上是指对于一个估计量，屡次变更数据反复

e商务文档

六西格玛数据分析技术4

相关文档推荐：