第六章 参数估计
因此,如果在α水平上拒绝H0,μ0必然落在μ的 (1-α)之外; 类似地,如果在α水平上接受H0,则μ0必然落在μ的双侧(1α)置信区间内。
区间估计与假设检验的区别
目的不同:区间估计的目的是对未知参数的
一个取值变化范围的检验;假设检验是对已经 给出的有关未知参数的一个说法作检验。
态度不同:对未知参数给出估计的取值区间
σ未知时,μ的1- α置信区间:
s x t , df n 1 2 n
影响区间宽度的因素
数据的离散程度(用 s 来测度) 样本容量 n 置信水平 1 - α
【例 1】某大学从该校学生中随机抽取 100 人,调查到 他们平均每天参加体育锻炼的时间为 26 分钟。试以 0.95 的置信水平估计该大学全体学生平均每天参加体 育锻炼的时间(已知总体标准差为6分钟)。 解: 已知 x =26,=6,n=100,1- = 0.95,Z/2=1.96 , x Z 2 x Z 2 n n 6 6 26 1.96 , 26 1.96 100 100 24.824, 27.176 以 95 %的概率保证平均每天参加锻炼 的时间在24.824~27.176 分钟之间。
σ已知时,μ的1 - α置信区间:
x u
2
n
σ未知时,μ的1- α置信区间可由下式导出:
P t t t 2 2
1
1
x P t t s 2 2 n
s s P x t x t 1 n n 2 2
1. μ 的置信区间
σ 已知 σ 未知
σ已知时,μ的(1- α) 置信区间可由下式导出:
P u u u 2 2
x P u u 2 2 n
1
1
P x u x u 1 n n 2 2
2
估计量的评判准则-(有效性)
有效性:一个方差较小的无偏估计量称为一个 更有效的估计量。
P(X )
均值的抽样分布
B A
中位数的抽样分布
X
估计量的评判准则-(相容性)
相容性:随着样本容量的增大,估计量越来越 接近被估计的总体参数。
P(X )
较大的样本容量
B
较小的样本容量
A
X
小结
样本平均数和方差具有无偏性、有效性 和相容性等特点,因此样本平均数和方 差分别是 和 σ2 的最优估计。
2
df 2 ,df1 ,
2
df1 ,df 2 ,
s2
μ的双侧 (1-α) *100%置信区间: X t / 2,n1 s / n
对于假设检验: 如果拒绝H0(在α水平),则必有t < -tα/2,n-1或t > tα/2,n-1。
t x 0 / s / n t / 2,n1
x 0 t / 2, n 1s / n
区间包含总体未知参数的概率 表示为(1- α)
α 为显著性水平,是总体参数未包含在区间 内的概率
常用的置信水平值有 0.99,0.95,0.90
相应的显著性水平为 0.01,0.05,0.10
置信区间和置信水平
置信区间 样本统计量 (点估计)
置信下限
置信上限
例如:某班级平均分数在75~85之间,置信 水平是0.95。
可以导出μ1 - μ2的1 - α置信区间为:
x1 x 2 u
2
12
n1
2 2
n2
3.平均数差的置信区间
σi未知但相等时,
用类似的方法可以得到μ1 - μ2的1 - α置信区间:
x1 x 2 t
2
n1 1s12 n2 1s22
2
E ( X i2 ) nE ( X 2 ) n(V ( X ) E ( X ) 2 ) n( 2 2 )
n
E ( X i X ) nE ( X 2 )
E ( X ) V ( X ) E ( X )2
i 1 2
i 1 n
2
n 1 2 E (S ) (n( 2 2 ) ( 2 n 2 )) 2 n 1
第六章 参数估计
主要内容
点估计 区间估计
参数估计:
由样本统计量估计总体参数。 是估计总体参数的统计量。
估计量:
点估计
定义:从总体中抽取一个样本,根据该样 本的统计量对总体的未知参数作出一个数 值点的估计。例如:
总体平均数 可以由样本平均数、中位数和 众数来估计。 总体方差 σ2 可以用以下两个统计量估计:
区间估计与假设检验的关系
(为什么会得到相同的统计推断)
对于区间估计:
假设我们检验 H0: μ=μ0;HA: μ≠μ0 分析:对于双侧显著性水平 α,当且仅当 μ 的双侧 (1-α) 置信区间不包含 μ0 时,则在 α 水平拒绝 H0;而当且仅当 μ 的双侧 (1-α) 置 信区间包含 μ0 时,则在 α 水平接受H0。
时,应该有相当大的概率(1- α);假设检验是确 定对不能接受这个假设的容忍界限,不是非常 有把握不拒绝原假设。
3.平均数差的置信区间
σi已知时,由
x1 x 2 1 2 P u u 1 2 2 1 2 2 2 n n 1 2
σ 的 1 - α 置信区间为:
n1 n1
s
2 2
, s
2 1
2
【例2】一个混杂的小麦品种,株高标准差σ0=14 cm,经提纯后随机抽出10株,它们的株高为:90、 105、101、95、100、100、101、105、93、97 cm, 考查提纯后的群体是否比原群体整齐?
解: H0:σ=14;HA:σ ≠ 14 将小麦提纯试验的有关数据s = 4.92, n = 10及 上下侧分位数代入下式,
2 s 2F 2 2 df , df , 1 2 s2 2 2 P 2 2 2 s F s 1 1 1 df2 ,df1 , 2
1
1
5.方差比的置信区间
由此得出σ1/σ2的1 - α置信区间:
s2
s1 F
s1 F ,
1 n 2 ( X X ) i n i 1
1 n 2 ( X X ) i n 1 i 1
哪一个统计量是总体参数的最优估计量?
估计量的评判准则-(无偏性)
无偏性:估计量的数学期望等于总体参数。
P( X )
无偏 B A
有偏
C
X
μ
1 n 2 2 2 S ( X X ) 要证 E(S ) i n 1 i 1 1 n 1 2 先证 V ( X ) V ( X i ) 2 nV ( X i ) n i 1 n n n 1 n 1 2 2 2 2 E (S ) E ( ( X X ) ) E ( ( X 2 X X X )) i i i n 1 i 1 n 1 i 1
2
n 1s
2 0
2
x
i 1
10
i
x
2 0
218.1 1.11 2 14
解:
H0的拒绝域:因HA: σ < σ0 ,故为左尾检验, 当 χ2 <χ21-α时拒绝H0 (χ29, 0.99=2.09)。 结论: χ2=1.11<χ29, 0.99=2.09, 即P < 0.01,所以拒绝零 假设。 因此植株经提纯后变得非常整齐 。
s n1
2 2
, s
n1
2
1 2
解:得出 σ 的0.99置信区间为:(3.04,11.21)。 H0:σ=14不包含在置信区间内,应拒绝H0。 用置信区间进行假设检验:如果任一指定的值 μ0 不落在 μ 的双侧 (1-α) 置信区间内,则我们说 这个参数 μ 与 μ0有显著的差异,显著水平为 α。
【对比】一个混杂的小麦品种,株高标准差 σ0=14 cm,经提纯后随机抽出10株,它们 的株高为:90、105、101、95、100、100、 101、105、93、97 cm,考查提纯后的群体 是否比原群体整齐? 解:小麦株高是服从正态分布的随机变量
假设:H0: σ = σ0 =14 cm HA: σ < σ0 显著性水平: α= 0.01 使用χ2检验,ss=218.1
点估计的问题
如果样本均值x = 3 ,则 3 就是 的估计 值。 只给出了未知参数估计值的大小,没有考 虑抽样误差。
区间估计
区间估计:根据一个样本的观察值给出总 体参数的估计范围(区间)
该区间由样本统计量加减抽样误差而得到的 总体参数被包含在这一区间的概率称为置信 水平
置信水平
2. σ 的置信区间
2 n 1 s 2 2 P 1 2 1 2 2
2 2 n 1 s n 1 s 2 P 1 2 2 1 2 2
n 1 n 1 Ps s 1 2 n 1s / n
μ的双侧 (1-α)置信区间即
对于假设检验:
X t / 2,n1 s / n
如果拒绝H0(在α水平),则必有t < -tα/2,n-1或t > tα/2,n-1。 类似地,如果t > tα/2,n-1,则