抽样分布与参数估计总结
总体参数的估计区间,称为置信区间。
统计学原理
置信度
如果将构造置信区间的步骤重复多次,置信区
间中包含总体真值的次数所占的比例称为置信 水平(Confidence Level)。
也称为置信度或置信系数 (Confidence Coefficient)。
统计学原理
置信度与置信区间的关系
统计学原理
两个总体参数—比例之差
比例之差:大样本下,服从正态分布。 在估计时使用样本标准差替代。
统计学原理
两个总体的方差比
样本方差比的抽样分布为F分布 其中 第一自由度为n1-1,第二自由度为n2-1
2 s12 2 2 ~ F n1 1, n2 1 2 s2 1
统计学原理
例题:关于扑克牌的游戏
从一副扑克牌(52张)中,有放回地抽
出30张,其平均点数的分布规律如何?
如果以点数来赌胜负,什么区间的胜率
是95%?
统计学原理
统计学原理
第二节 参数估计
主要讨论总体平均数的 参数估计
统计学原理
参数估计的一般问题
参数估计:用样本统计量去估计总体的参
数。
统计学原理
计算结果
计算样本平均数:X=39.5 计算样本标准差:s=7.7736 令:总体标准差=样本标准差,计算抽样误差为
1.2956 95%置信度对应的T值为1.96 得总体平均数的置信区间为:
o 上限:39.5+1.96×1.2956=42.04 o 下限:39.5-1.96×1.2956=36.96
N=200时的抽样分布
Std. Dev = 2.23 Mean = 46.24 N = 200.00
4 .4 57 2 .0 53 0 .6 48 9 .1 44 7 .7 39 5 .3 35 4 .9 30 2 .5 26 0 .1 22
9 .6 70 7 .2 66 5 .8 61
N=100
N=200
统计学原理
对计算结果的说明
严格地说,在这个例子中,不应当根据正态分布进行估
计,而应当使用T分布进行估计。 如果使用T分布,自由度为35,95%置信度的概率度(t)是 2.03,而非1.96。计算出来的置信区间比正态分布的情 况要略大一些。 置信区间略大的原因,在于使用S替代总体标准差时,本 身也包含了一定的误差。 实践中,社会调查的样本量一般都比较大,正态分布与T 分布的差异不明显,因此可以用正态分布进行近似分析。 例如,当样本量为200时,T分布的95%概率度为1.9719, 与正态分布的1.96已经没有太大区别了。
统计学原理
一个总体参数—总体均值
正态总体,方差已知;
o 或非正态总体,大样本,方差已知。
x z ~ N (0,1) X n 置信区间: ( x z a
2
X
n
, x za
2
X
n
)
注意:Z取a/2的原因在于此时置信 区间是最小的。
统计学原理
一个总体参数—总体均值
正态总体,方差未知
袋,计算样本方差为93.21,试在95%的置信度水平下 ,估计总体的方差 假定总体方差为σ2,可知
n 1s 2 2 n 1 K ~ 2
CHIINV(0.025,24)=39.36 CHIINV(0.975,24)=12.40 由12.40<K<39.36,可得σ2的置信区间为 (56.83,180.39)
统计学原理
总体比例的区间估计
在大样本的情况下,样本比例P的抽样分布为正 态分布。可以利用正态分布进行区间估计。
统计学原理
比例估计的标准差
比例估计的情况下,如果未知总体方差,
可以用样本方差替代。严格的计算公式 应当为
n s p (1 p ) n 1
2
在实践中,经常直接使用p(1-p)作为近
o 1.样本量n>30时,样本平均数服从正态分布 o 2.样本平均数以总体平均数为期望值 o 3.样本平均数的方差为
x
2
2
n
统计学原理
导入:估计样本平均数的范围
某总体方差为 100 ,平均值为 40 ,抽出一
个36个单位构成的样本,试在95%的置信 度水平下,估计样本平均数的范围。
统计学原理
评价估计量的标准
无偏性(Unbiasedness)
有效性(Efficiency)
o 估计量的标准差最小。 o 估计量的期望值等于总体参数值。
一致性(Consistency)
o 大样本获得的估计量比小样本更接近总体参 数值。
统计学原理
有放回条件下的简单随机抽样
依据:样本平均数的分布特征
统计学原理
第六章 抽样分布与参数估计
抽样分布、参数估计和 假设检验是推断统计的 三个中心内容
统计学原理
第一节 抽样分布
统计学原理
基本概念
统计量:由样本构造出来,不依赖于任
何总体参数的函数。 参数:描述总体分布状况的数。
统计学原理
抽样分布
抽样分布:统计量的分布形式 统计量的分布依赖于总体的分布,同时与抽样
x t ~ t (n 1) s n s 置信区间 : x ta 2 n
t分布以正态分布为渐近分布,一般当n大于 30时,t分布与正态分布已经十分接近,可 以使用正态分布来进行处理
统计学原理
T分布概率密度函数
统计学原理
T分布曲线
统计学原理
例题:T分布
已知某产品的使用寿命服从正态分布,现随机抽取16件,
统计学原理
第三节 常见的参数估计题型
本章为选修内容,涉及到数 理统计中较多知识,需要通 过习题来加以掌握。
统计学原理
估计中的要点
参数估计是从统计量的抽样分布入手,
利用统计量的分布特征,倒推出总体参 数的置信区间。
o 所有分布特征,都是基于统计量的抽样分布 o 总体参数是常数,统计量是随机变量。
以正态分布为例,当置信度为P时,置信
区间为[μ-tσ,μ+tσ] 其中,μ为期望值,σ为标准差。 T称为概率度,以下为对应关系
概率度(t) 概率值(p) 概率度(t) 概率值(p) 1.28 80% 1 68.27% 1.64 90% 2 95.45% 1.96 95% 3 99.73% 2.58 99%
统计学原理
F分布的密度函数
统计学原理
F分布
统计学原理
第四节 样本量的计算
统计学原理
样本量的确定
估计总体均值时样本量的确定
统计学原理
总体标准差的确定
根据以往的经验数值推算 通过试访问推算 采用序贯抽样方法 在比例估计时,使用p(1-p)的最大值替代。
2 ( x x ) i
s
n 1
统计学原理
例题:估计总体平均数
一次调查中获得了36个样本的数据如下 23 35 39 27 36 44 36 42 46 43 31 33 42 53 45 54 47 24 34 28 39 36 44 40 39 49 38 34 48 50 34 39 45 48 45 32 试在95%的置信度水平下,估计总体平均数的置信区间。
似。
统计学原理
一个总体—总体方差
当总体为正态分布时,样本方差与总体
方差之比以以下的方式服从n-1个自由的 卡方分布
(n 1) S
2
2 X
~ n 1
2
统计学原理
卡方分布的密度函数
统计学原理
卡方分布
统计学原理
例题:卡方分布
已知一批食品的重量服从正态分布,从总体中抽选25
查表,24个自由度的卡方值分别为
统计学原理
两个总体参数—均值之差
两个总体均值之差:独立样本,大样本
统计学原理
两个总体参数—均值之差
两个总体均值之差:独立样本,小样本
o 两个总体的方差未知,但相等; o 两个总体的方差未知,不相等,但样本量相 等; o 两个总体的方差未知,不相等,样本量不相 等。
统计学原理
样本均值抽样特征的推导
统计学原理
统计学原理
统计学原理
抽样标准误
在任何一项抽样中,统计量的标准差称
为抽样标准误。 在利用样本平均数估计总体平均数时, 抽样标准误即为样本平均数的标准差, 即前文中推导出来的 x
统计学原理
无放回条件下的简单随机抽样
统计学原理
无放回条件下抽样公式的简化
N=10
N=30
N=100时的抽样分布
80 70 60 50 40 30 20 10 0 22.3 27.6 32.9 38.2 43.5 48.8 54.1 59.4 64.7 70.0 72.7 25.0 30.3 35.6 40.9 46.2 51.5 56.8 62.1 67.4 Std. Dev = 3.14 Mean = 46.1 N = 200.00 0 20 40 60 80
N=30时的抽样分布
80 70 60 50 40 30 20 10 0 22.5 25.4 28.4 34.2 31.3 40.1 37.2 46.0 43.1 51.9 49.0 57.8 54.9 63.7 60.7 66.6 69.6 72.5 Std. Dev = 6.47 Mean = 46.6 N = 200.00
估计量与估计值
o 用于估计总体参数的样本统计量的名称叫估 计量; o 根据一个具体样本计算出来的估计量的数值 叫估计值。
统计学原理
点估计与区间估计
点估计是用样本统计量的某个取值直接作为总