当前位置:文档之家› 第五章 参数估计

第五章 参数估计

(总体方差未知时,以样本方差代替)
1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:

分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:

一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计

利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:

当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
样本统计量 X,S2,p
3
第五章 参数估计
第一节 参数估计的原理
第二节 总体参数的区间估计
第三节 样本容量的确定 第四节 SPSS在参数估计中的应用
4
第一节 参数估计的原理
一、点估计与区间估计
二、优良估计量的评价标准
三、区间估计原理
Back 5
一、点估计与区间估计

点估计:以样本统计量的某一具体数值估计 未知的总体参数。该统计量称为估计量。 (一个样本)
( X z 0.0455
2
) n
12 , 26 2 , 23.6,28.4 100
有95.45%的可靠程度,估计该学院学生平均每 天体育锻炼时间在23.6到28.4分钟之间。
17
例题:

从某公司生产的一批罐装产品中,随机抽取
10罐产品的重量分别为(单位:g)
S1=230元,X2=2485元,S2=482元。求两城市
职工平均月收入的99%的置信区间。
21
解答:要求两总体均值差的99%置信区间
两总体均为大样本,1-α=99%,α=0.01 两总体均值差(μ1- μ2)的99% 置信区间为
X
1
X 2 z
2
S12 S 22 n1 n2
2 2 230 482 1650 2485 2.57 ; 897.70,772.21 400 500 估计城市1和城市2职工平均月收入在99%的置 信度下,相差在772.21元至897.79元之间。


点估计不能提供估计参数时的 估计误差大小,但区间估计可以。
Back7
二、优良估计量的评价标准

估计总体参数的方法有很多种,不同方法得到不 同的估计量。例如:对总体均值进行估计时,可 以采用样本均值,也可以采用样本中位数。

问题:什么样的估计量才是好的?
无偏性:估计量的数学期望值与总体参数的真实值相等。 有效性:两个无偏估计量中方差较小的估计量较为有效。 一致性:随着样本容量增大,估计量的取值应该越来越接近 总体参数。
( X z 0.05
2
S ) n
5 , 20 1.96 , 18.6,21.4 49
有95%的可靠程度估计每周在香烟上的平均消 费额在18.6元和21.4元之间。
Back 24
二、总体比例的区间估计
待估计 参数θ 已知条件 置信度100(1-α)% 的置信区间
总体成数 /比例 P
19
一、总体均值的区间估计(两个总体)
待估计 参数θ 已知条件
两正态总体 σ1、σ2已知
置信度100(1-α)% 的置信区间
X
X
1
X 2 z
2
12
n1

2 2
两个总体 均值之差 μ 1- μ 2
n2

2 Sp
两正态总体 σ1、σ2未 知,假定σ1=σ2 任何总体 n1≧30 n2≧30
两个总体 成数之差 P1- P2
大样本且np>5,nq>5
p z
2
p1 p n
p1 1 p1 p2 1 p2 n1 n2
两独立总体,大样本 n1p1>5,n1q1>5 n2p2>5,n2q2>5
p1 p2 z
2
25
例题:

某商场从顾客中随机抽取200人,其中持信 用卡消费的顾客有6人。 试求在90%的置信度下,顾客持信用卡消费 的比例的置信区间。
θ是待估计参数,由样本确定两个统计量θL和θU 满 足: P(θL<θ<θU)= 1 –α
随机区间(θL,θU)是置信度为1–α时θ的置信区间 (confidence interval)。θL:置信下限;θU:置信上限
10
(一)置信区间的定义

θL和θU都是随机变量(统计量),是不确定的。 在区间估计中,置信度为100(1–α)%的含义 是:在根据不同样本得到的所有置信区间中,
当n一定时,置信度越高,置信区间的范围越大, 则估计的参数的精确性越低。
Back 12
(二)区间估计的步骤
Back
Step1:找出一个已知抽样分布的随机变量,该随机变量 包含参数θ,但不包含其它未知参数。 X Z ~ N 0,1 n 如:对μ估计,σ2已知
Step2:根据给定的1–α,在抽样分布中确定临界点。
26
解答:
本题是对总体比例的估计,p表示样本中持信用卡消费 的顾客比例,p=6/200=0.03, 1-α=0.9,α=0.1 。由 题意可知,n=200 属于大样本,且np=6和n(1-p)=194均 大于5。因此,总体比例P的90%置信区间为
( p z 0.1
2
p1 p ) n
0.0102,0.0498
顾客辨识正确比例在27%和33%之间,可靠程度为99%。 也就是同样方法构造的约99%的区间包含总体比例。
Back 29
三、正态总体方差的区间估计
待估计 参数θ 总体方差 σ2 已知条件 置信度100(1-α)% 的置信区间
正态总体
2 2 n 1S n 1S , 2 2 n 1 1 n 1 2 2
0.031 0.03 , , 0 . 03 1 . 64 200
顾客中持信用卡消费的比例在1.02%至4.98% 之间,可靠程度为90%。
27
思考题:

一项市场调查想了解家庭主妇中有多少人只要 通过容器形状和颜色就可以辨认出清洁剂的品 牌。在被抽到的1400名主妇中有420位具有这
318,320,322,321,321,
323,319,320,320,324
要求以95%为置信度,估计该公司这批产品
平均重量的置信区间。已知罐装产品重量服 从正态分布。
18
解答:要求总体均值μ的95%置信区间
随机变量X表示罐装产品的重量,由题意可知,σ 未知,以样本数据计算均值和方差, 1-α=95%, α=0.05,n=10 属于小样本。

样本均值X、样本比例p和样本方差S2分别是总体
均值μ、总体比例P和总体方差σ2的最佳估计量。
Back8
三、区间估计原理
(一)置信区间的定义
(二)区间估计的步骤
Back9
(一)置信区间的定义

给定一概率值所建立的包含待估计参数的区间, 称置信区间,相对应的概率值称置信系数或置信 度,以(1- α)表示,α是一个小概率,表示区间 估计不可靠概率。(α常取0.05, 0.1, 0.01) 。

需要特别指出的是:所有的统计推断都要以随机样本为 基础,如果样本是非随机,统计推断方法就不适用。
2
第五章 参数估计
总体参数是常数,但常未知,需要用样本统计量去估计。
参数估计是根据样本统计量的数值对 总体参数进行估计的过程。
总体:拉萨市民(收入,满意度) 样本: n 人 抽样
总体参数μ,σ2,P
推论 估计/检验
n≧30,σ已知
n≧30,σ未知 总体均值 μ
n<30,正态总体,σ已知 n<30,正态总体,σ未知
X z
2

n S n
X z
2ቤተ መጻሕፍቲ ባይዱ
X z
2

n
S X t n 1 n 2
15
例题()

某大学从某一学院中随机抽取学生100人,得 知他们平均每天用于体育锻炼的时间为26分 钟。根据以往数据知道,该学院学生每天锻
1 P X z X z n n 2 2
13
第二节 总体参数的区间估计
一、总体均值的区间估计
二、总体比例的区间估计
相关主题