第四章_参数估计
N—总体容量 总体容量
δ2 1 n 1 n D x = D ∑xi = 2 ∑D(xi ) = n n i=1 n i=1
9
()
抽样分布
2. 抽样分布
若 体 ~ µ,δ 2 , x1, x2 ,Lxn 是 自 体 随 样 , 总 X N 取 总 的 机 本 1 n x = ∑xi , 则 n i=1 δ2 x−µ ; x ~ N µ, , δ n ~ N(0 1) n
0
x
11
抽样分布
2. 抽样分布
E( p) = P
E(p)—随机变量 p 的数学 随机变量 期望 P—总体比率 总体比率
对于样本某一指标的比例 p ,满足下面两 个条件时认为样本容量足够大: 个条件时认为样本容量足够大: —— np ≥ 5 ——
n(1− p) ≥ 5
P(1− P) δp = n
σp
pp的分布 的分布
p−P ~ (0 1) N , P(1− P) n
n—样本容量 样本容量 N—总体容量 总体容量
12
抽样分布
2. 抽样分布
0.30
s2 服从卡方分布,但其分布 服从卡方分布, S的分布 的分布 函数不便于用数学式直接表达。 函数不便于用数学式直接表达。可 以得出与其相联系的一个服从自由 的卡方分布的统计量。 度为 n-1的卡方分布的统计量。 的卡方分布的统计量
2 其中µ和 2是未知总体参数。从中随机抽取5只灯 布N(µ,δ ),其中 和δ 是未知总体参数。从中随机抽取 只灯 ( , ),其中
小时、 小时、 小时、 泡,测得使用寿命分别为1529小时、1513小时、1600小时、 测得使用寿命分别为 小时 小时 小时 1527小时、1111小时。试估计 和δ2。 小时、 小时。 小时 小时 试估计µ和
E(x) = µ
样本均值的期望与 样本容量无关
δx =
δ
n
样本均值的标准差 与样本容量有关
n = 30
δx = 730.30
51800
14
二、点 估 计
点估计的概念 估计量的优良性
15
1. 点估计的概念
某连续生产线上生产的灯泡构成的总体的使用寿命X服从正态分 某连续生产线上生产的灯泡构成的总体的使用寿命 服从正态分
(
)
当总体为正态概率分布时 当总体为正态概率分布时, 对任何样本容量的样本均值 的分布也是正态分布。 的分布也是正态分布。 x
当总体为任意分布时, 当总体为任意分布时
中心极限定理( 中心极限定理(central limit theorem) )
当样本容量n→ 时 当样本容量 →∞时, 样本 均值 的抽样分布渐进为正
___
x =
∑x = 1529 +1513 +1600 +1527 +1411 =1516
n 5
2
___ x − x ∑ 2 2 = (1529 −1516) +L+ (1411−1526) = 4595 2 s = n −1 5 −1
从总体中抽取一个样本, 从总体中抽取一个样本,构造适当的统计量 来估计对应的总体参数θ 来估计对应的总体参数θ。
第四章 参数估计
参数估计的基本理论
1
参数估计的基本理论
抽样与抽样分布 点估计 区间估计
2
一、抽样与抽样分布
1.抽样方法 抽样方法 2.抽样分布 抽样分布 3.样本容量与抽样分布 样本容量与抽样分布 样本容量与
3
总体容量 (population size) ) N=45
1. 抽样方法
样本容量(sample size) 样本容量( ) 为推断总体的某些特征, 为推断总体的某些特征, 而从总体中按一定方法抽取若干 总体( 总体(population) ) 个体,这一过程称为抽样, 个体,这一过程称为抽样,所抽 抽样 取的个体组成的局部整体称为样 本。 抽样( 抽样(sampling) ) 样本( 样本(sample) )
简单随机样本
6
的。
抽样分
2. 抽样分
随机性 随机抽样随Fra bibliotek性 计算 样 本
理 论 上 可 计 算
总 体
统计量
X , S2 , p
样本统计量作为随机变量,具有特定的概率分 样本统计量作为随机变量, 的分 总 体 的 , 样本统计量的分 为抽样分 为抽样分
总体 定 性
µ,σ 2 , P
7
抽样分布 0.30 0.25 0.20 0.15 0.10
自正态总体抽样时, 自正态总体抽样时,总体均值与总 体中位数相同, 体中位数相同,而中位数的标准误差大 约比均值的标准误差大25%。因此,样 约比均值的标准误差大 。因此, 本均值更有效。 本均值更有效。
(2)有效性 )
x
Me
的抽样分布
的抽样分布
____
X
20
一致性
(3)一致性 )
∧ 如 lim P θ −θ p ξ =1(ξ为 意 果 任 小数 为 本容 ) ,n 样 量 n→∞ 则 θ 为θ的 足 致 标准 点估 量 称 满 一 性 的 计
9 23 36 38 25 12 23 7 2 3
从有限总体抽取的简单随机抽样
5
无限总体
1. 抽样方法
自无限总 体的简单 随机抽样
自无限总体抽取样本, 自无限总体抽取样本,采用无放回抽 如果满足以下两个条件, 样。如果满足以下两个条件,则称简 单随机抽样: 单随机抽样: (1)每个个体来自同一个总体。 )每个个体来自同一个总体。 (2)样本中每个个体的抽取是独立 )
∧
s2 p 均为一致性估计量 x
n较 时 抽 分 大 的 样 布
ˆ θ1的抽样分布
ˆ θ2的抽样分布
θ
两个无偏点估计量的抽样分布
ˆ θ
n较小时的抽样分布
θ
两个不同容量样本的点估计量的抽样分布
21
ˆ θ
三、区间估计
1.总体均值的区间估计 总体均值的区间估计 2.总体比率的区间估计 总体比率的区间估计 3.样本容量的确定 样本容量的确定 4.总体方差的区间估计 总体方差的区间估计
__ x− µ P− Zα p p Zα =1−α 2 2 n σ
显著性水平 α
α=
α
2
+
α
2
__ σ σ __ Px− Zα p µ p x+ Zα =1−α 2 2 n n
置信度 1-α α 1−α
α
0
α
2
2
显著性水平α下 显著性水平 下,µ在1- α置信水平下的 在 置信水平下的 置信区间: 置信区间:
x 的分布
2. 抽样分布
N=1000名公司员工总体,抽取 名公司员工总体, 名公司员工总体 500个容量为 个容量为n=30的简单随机 个容量为 的简单随机 样本的平均年薪、 样本的平均年薪、大学毕业生比
0.05
率、年薪标准差的分布直方图。 年薪标准差的分布直方图。
50000 51000 52000 53000 54000 0.40 0.30 0.25 0.20 0.15 0.10 0.10 0.05 0.05 2600 3400 4200 5000 0.32 0.48 0.64 0.80 0.35
的分布即可用正态近似。 值 x 的分布即可用正态近似。
10
抽样分布
中心极限定理作用下
x 的概率密度
f ( x)
2. 抽样分布
1
δx =
δ
n
f ( x) =
(x−µ) −
e
2δ x2
2
δ x 2π
E(x) = µ
x
标准正态分布
x−µ 1 = f e δ n 2π
x − 2
2
X~ µ, .152 0
(
)
α = 0.05
n = 9σ = 0.15 1−α = 0.95x = 2.14 α = 0.025 Zα 2 =1.96 2
__
σ __ σ __ , x + Zα x − Zα 2 2 n n
0.15 0.15 21.4 −1.96 ,21.4 +1.96 = (21.302 9 9 21.498)
∧ Eθ ≠ θ
偏差
θ
参数θ等于抽样 参数 等于抽样 参数θ不等于抽样 参数 不等于抽样 分布的均值(无 分布的均值( 分布的均值( 分布的均值(有偏 _ _ _ 偏估计量) 偏估计量) 估计量) E x = µ 估计量)
E ( p) = P E ( s2
θ
∧
µ 设任意总体均值为 , 方差为δ 2 , x1, x2 ,Lxn 是取自总体的随机样本 , 1 n 态分布。 态分布。 x = ∑xi, 则当 n → ∞时 n i=1 δ2 x−µ 实践中, 实践中,当n≥30,样本均 , x ~ N µ, ; 1 n δ n ~N(0,)
X
μ———总体的均值 总体的均值
1 n 1 n E x = E ∑xi = ∑E(xi ) = µ n i=1 n i=1
()
S=
σ
n
设总体均值为µ, 设总体均值为 ,总体方 差为σ 则有: 差为 2 ,则有:
S—随机变量 x 的标准差 随机变量 σ—总体的标准差 总体的标准差 n—样本容量 样本容量
,
θ
∧
这说明, 的点估 这说明,µ的点估 计是1516小时; 小时; 计是 小时 σ2 的点估计是 16 2 4595小时 小时
2. 估计量的优良性
无偏性 有效性 一致性