当前位置:文档之家› 六西格玛数据分析技术4

六西格玛数据分析技术4

六西格玛数据分析技术4
2020年7月13日星期一
σ
σ σ σ σ σ σ σ σ

返回目录
第4章 参数估计
4.1 参数估计的基本概念 4.2 总体均值和总体比例的区间估计 4.3 样本容量的确定 4.4 两总体均值之差的区间估计 4.5 两总体比例之差的区间估计 4.6 正态总体方差的区间估计 4.7 两个正态总体方差比的区间估计 4.8 有关区间估计的Minitab软件实现
矩估计法(续)
解:因为μ是全体灯泡的平均寿命, 为样本的平均寿命,很自 想到用 去估计μ;同理用s去估计σ。
由于
例4-2.设样本x1,x2,…, xn来自参数为λ 的泊松分布。由于 E(X)=D(X)=λ,因而 与s2都可以作为λ的矩估计值。
由例4-2可以看出E(X)=D(X)=λ,这表明总体均值与方差相
在进行区间估计时,必须同时考虑置信概率与置 两个方面。即置信概率定的越大,则置信区间相应 。这两者要结合考虑,才更为实际。
14
返回目录
4.2 总体均值和总体比例的区间
总体均值的区间估计
➢当X~N(μ,σ2)时, x1,x2,…, xn是来自该正态总体的随


➢ 当总体方差σ2已知时,μ的1-α置信区间为:
解:样本x1, x2,…, xn的联合密度
用均值
来表示,就有:
,将 看作常数, λ看作变量,可得似 ,进而取对数,求微商,解方程可得: 对本例而言,就有:
10
返回目录
点估计的优良性准则
不同的参数估计方法,可得到不同的估计量,不同的估 谁优谁劣?我们有一些相应的评价准则。在6σ管理中, 用的点估计优良性准则有两个:一个是无偏性,另一个
➢3.必要样本容量n与正态分布Z1-α/2分位数(也称可 数)成正比。即:我们要求的可靠程度越高,样本
就应越大;如果要求的可靠程度越低,样本容量
以小些。
24
返回目录
样本容量的确定(续3)
例4-8.某广告公司想估计某类商场去年 所花的广告费平均有多少。经验表明, 总体方差约为1800000。如置信度取 95%,并要使估计值处在总体平均值 附近500元的范围内,这家广告公司 应取多大的样本?
个数值 区间估计包含了两个数值,对应着数轴上的一个区
,所以称为区间估计 点估计的方法最常用的有两种:
•矩估计法 •极大似然估计法 对一个估计优良性的评价有一些相应的评价准则
4
返回目录
矩估计法
对总体参数的估计,人们最容易想到的方法就是矩估 即用样本矩估计总体相应的矩,用样本矩的函数估计 应矩的函数。
差为σ2,只要n>1,作为μ的估计值, 比x1就更有效。
12
返回目录
区间估计
点估计没有给出估计的精度和可靠程度,区间 解决了这一问题。
设θ是总体的一个待估参数,从总体中获得容量 的样本是x1, x2,…, xn,对给定的α(0<α<1),有统 : θL=θL(x1, x2,…, xn) 与θU=θU(x1, x2,…, xn) 若对任意θ有P(θL≤θ≤θU )=1-α,则称随机区间 ]是θ的置信水平为1-α的置信区间。 θL 与θU分别称为1-α的置信下限与置信上限, 显著性水平。
小组讨论与练习
2
返回目录
本章目标
1.掌握参数估计的基本概念 2.建立起在管理中运用参数估计的思想 3.能运用Minitab实现各种区间估计的计算 4.掌握样本容量的确定方法 5.能在管理实践中运用参数估计方法
3
返回目录
4.1 参数估计的基本概念
参数估计有两大类,一种叫点估计,一种叫区间估 点估计是利用样本的信息对所感兴趣的参数估计出
➢ 解:已知X~N(μ,0.152)时, =2.14,n=9,1-α=0.95, α=0.0 标准正态分布表可得1-α/2的分位数,Z1-α/2=1.96;α=0.0 Z1-α/2=2.58; α=0.10时, Z1-α/2=1.64。这是一些常用值, 记住。
➢ 我们可以95%的概率保证这种零件的平均长度在(21.302 之间。
17
返回目录
例4-5.σ2未知时,μ的区间估计
为了估计各省市电视台在某黄金时间一分钟广告的平均 随机调查了20个电视台,他们每分钟的广告费 =25000 s=8000元。假定所有电视台的广告费近似遵从正态分布 总体均值95%的区间估计。
➢ 解:这是总体方差σ2未知的情况。已知 =25000,s=800 n=20, α=0.05,则t1-α/2(n-1)= t0.975(19)=2.093;于是
让10个人挑选10支不同颜色的铅笔,只有9人有自由挑 能,因为当这9人都挑好之后,你别无选择!因此这个 自由度为9。
自由度可以理解为在研究问题中,可以自由取值的数据 。
16
返回目录
例4-4.σ2已知时,μ的区间估计
某种零件的长度遵从正态分布,从该批零件中随机抽取 测得其平均长度为21.4mm。已知总体标准差σ=0.15mm, 立该种零件平均长度的置信区间,给定的置信水平为0.
可以证明:若x1, x2,…, xn来自正态总体N(μ,σ2),则:
9
返回目录
极大似然估计(续3)
例4-3.设某种品牌的电视机的首次故障时间遵从指数分布f(t)=λe 测试了7台电视机,获得相应的首次故障时间(单位:万小时) 1.49,3.65,0.26,4.25,5.43,6.97,8.09 求参数的λ估计值。
解之得: 只要我们知道了Z1-α/2,σ和允许误差,就可具体
本容量n。 如果算出的n不是整数,就去超过该小数的最接
数即可。
23
返回目录
样本容量的确定(续2)
由样本容量的确定公式 量之间的一些关系:
,你可发现
➢1.总体方差越大,必要的样本容量n越大。
➢2.必要样本容量n反比例于允许误差B。即在给定 水平下,允许误差越大,样本容量就可以越小; 误差越小,样本容量就必须加大。
矩是指以期望值为基础而定义的数字特征,例如均值 、协方差等。
最常用的矩估计有:用样本均值估计总体均值,用样 差估计总体标准差。
例4-1.已知某种灯泡的寿命 X~N(μ,σ2),其中μ,σ2 ,今随机抽取4只灯泡,测得寿命(单位:小时)为150 1453,1367,1650。试估计μ,σ。
5
返回目录
在实际问题中 与s2不见得一样,因而矩估计的结果不惟一。
6
返回目录
极大似然估计
极大似然估计是利用总体的分布密度或概率分布的表达式 样本所提供的信息建立求未知参数估计量的一种方法。
极大似然估计好多初学者觉得难以理解,我们用下面的说 助理解:在产品检验中,有说这批产品的次品率可能是 1/10000,也有说次品率可能是1/100。 如果你在这批产品中随机抽取一件,竟然 就是次品,自然应当认为这批产品的次品 率最有可能是1/100而不是1/10000。把这 种考虑问题的方法一般化,就概括出极大 似然估计方法。
例4-6.某航空公司在过去飞行记录中,随机抽取了 航班,航班空位数的样本均值 =11.6,标准差=4.1 求过去一年所有航班的平均空位数的置信区间。(α
➢解:所有航班空位数的分布未知,且总体标准差未
但n=225,因而仍可用
做区间估计。
具体数据得[11.15,12.05],也即该公司有90%的把
过去的一年该公司的平均空位数在11.15到12.05之间
➢ 解:已知σ2=1800000,α=0.05,Z1-α/2=1.96,B=500
➢ 即这家广告公司应抽取28个商场作样本。
25
返回目录
样本容量的确定(续4)
估计总体比例时,样本容量n的计算公式是:
例4-9.某市场调查公司想估计某地区有数码相机的 占的比例。该公司希望对p的估计误差不超过0.05,要 可靠度为95%,应取多大的样本?没有可利用的 估
20
返回目录
总体比例置信区间估计的例子
例4-7.某企业在一项关于职工流动原因的研究中,从该 前职工的总体中随机抽选了200人组成一个样本。访问结 有140人说他的离开是由于企业管理缺乏人性化。试对由 种原因而离开企业的人员的真正比例进行估计(α=0.05)。
➢ 解:已知n=200, =0.7, =140>5,
13
返回目录
区间估计(续)
置信区间的大小表达了区间估计的精确性,置信 达了区间估计的可靠性, 1-α是区间估计的可靠概 而显著性水平α表达了区间估计的不可靠的概率。
如果[θL ,θU ]是置信水平为0.95的置信区间,由于 间[θL ,θU ]会随样本观察值的不同而不同,它有时包 参数θ ,有时没有包含θ ,但是用这种方法作参数 间估计时,100次中大约有95个区间能包含着参数 约有5个区间没能包含θ 。
其中Z1-α/2是标准正态分布的1-α/2分位数。 ➢ 当总体方差σ2未知时,σ用其s代替,用t分布,μ的1
区间为:
其中t1-α/2(n-1) 表示是自由度为n-1的t分布的 1-α/2分
15
返回目录
关于自由度
在统计推断中常常会碰到自由度这一 概念,不少人对这一概念不好理解。
如果我们有10个数,而且你知道了均值和其中的9个数 那么你就可以推出第10个数。
合概率密度函数。
8
返回目录
极大似然估计 (续2)
一般情况下,我们用求解似然方程的方法进行极大似然 具体步骤是: 1.由总体分布导出样本的联合概率密度; 2.把样本联合概率密度中自变量x1, x2,…, xn看成已知 ,而把参数看作变量,得到似然函数; 3.用微分原理求似然函数的最大值点; 4.在最大值点的表达式中,代入样本值就得参数的估计
性。
无偏性:设 是参数θ的一个估计量,如果 是参数θ的无偏估计。
,则
➢ 无偏性实际上是指对于一个估计量,屡次变更数据反复
相关主题