当前位置:文档之家› 第2讲 抽样分布与参数估计

第2讲 抽样分布与参数估计


B
A
中位数的抽样分布

X
估计量的优良性准则
(一致性)
一致性:随着样本容量的增大,估计量越来越接 近被估计的总体参数
P(X )
较大的样本容量
B A
较小的样本容量

X
区间估计
区间估计
(概念要点)
1. 根据一个样本的观察值给出总体参数的估计范围 2. 给出总体参数落在这一区间的概率
3. 例如: 总体均值落在50~70之间,置信度为 95%
一. 点估计 二. 点估计的优良性准则 三. 区间估计
参数估计的方法
估 计 方 法



区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
被估计的总体参数
总体参数 均值 一个总体 比例 方差 均值之差 两个总体 比例之差 方差比 符号表示
用于估计的 样本统计量

P
x ˆ p
s2 x1 x2 ˆ1 p ˆ2 p
x 2.5
2 x 0.625
样本均值的抽样分布 与中心极限定理
当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所 有容量为n的样本的均值X也服从正态分布,X 的 数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
总体均值的区间估计
(非正态总体:实例)
解:已知 x = 26, =6 , n=100, 1- = 【例】某大学从该 0.95,Z/2=1.96 校学生中随机抽取 100 人 , 调 查 到 他 x Z 2 , x Z 2 们平均每天参加体 n n 育锻炼的时间为 26 6 6 分钟。试以 95 %的 ,26 1.96 26 1.96 100 100 置信水平估计该大 学全体学生平均每 24.824,27.176 天参加体育锻炼的 我们可以 95 %的概率保证平均每天 时间(已知总体方 参加锻炼的时间在 24.824 ~ 27.176 差为36小时)。 分钟之间
总体、个体和样本
(概念要点)
总体(Population):调查研究的事物或现象的全体
个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量
样本均值的抽样分布
抽样分布
(概念要点)
1. 所有样本指标(如均值、比例、方差等) 所形成的分布称为抽样分布
总体均值的区间估计
(实例)
【例】从一个 正态总体中抽 取一个随机样 本, n = 25 ,其均值x = 50 , 标 准 差 s = 8。 建立 总体均值 的 95% 的置信区 间。
解:已= 0.95,t/2=2.0639。 s n 1 s n 1 , x t 2 x t 2 n n
95% 的样本
99% 的样本
置信水平
1. 总体未知参数落在区间内的概率 2. 表示为 (1 -

为显著性水平,是总体参数未在区间内 的概率 相应的 为0.01,0.05,0.10
3. 常用的显著性水平值有 99%, 95%, 90%

区间与置信水平
均值的抽样分布
/2
x
1-
置信区间 样本统计量 (点估计)
置信下限
置信上限
置信区间估计
(内容)
置信区间
均 值 2 已知 2 未知
比例
方差
落在总体均值某一区间内的样本
X = Zx

_ x
- 2.58x
-1.65 x
+1.65x
+ 2.58x
X
-1.96 x
+1.96x
90%的样本
两个样本方差比的抽样分布
设X1,X2,… ,Xn1是来自正态总体N~(μ1,σ12 )的 一个样本, Y1 , Y2 , … , Yn2 是来自正态总体 N~(μ2,σ22 ) 的 一 个 样 本 , 且 Xi(i=1,2,… , n1) , Yi(i=1,2, …,n2)相互独立,则
s

2 x 2 1
/2
x
(1 - ) % 区间包含了
X
% 的区间未包含
影响区间宽度的因素
1. 数据的离散程度,用 来测度
x 2. 样本容量, n
3. 置信水平 (1 - ),影响 Z 的大小
第三节 总体均值和总体比例 的区间估计
一. 总体均值的区间估计 二. 总体比例的区间估计 三. 样本容量的确定
均值和方差

X
i 1
N
总体分布
.3
i
N
N i 1
2.5
2
2 ( X ) i
N
1.25
.2 .1 0
1 2 3 4
样本均值的抽样分布
(一个例子)
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
所有可能的n = 2 的样本(共16个) 第一个 观察值 第二个观察值 1 2 3 4
T 统计量的分布
设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12 )的一个 样本, 称 n( X ) 为统计量,它服从自由度为(n-1)的t 分布 T S
t 分布
标准正态分布
t (df = 13)
正态分布
t (df = 5)
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
第二节 参数估计基本方法
2. 是一种理论概率分布 3. 随机变量是 样本统计量

样本均值, 样本比例等
4. 结果来自容量相同的所有可能样本
样本均值的抽样分布
(一个例子)
【例】设一个总体,含有4个元素(个体),即总体单 位数 N=4 。 4 个个体分别为 X1=1 、 X2=2 、 X3=3 、 X4=4 。总体的均值、方差及分布如下
= 50
X
x 50
X
总体分布
抽样分布
中心极限定理
(图示)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
抽样分布与参数估计
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
统计推断的过程
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
抽样与参数估计
1、 2、 3、 4、 5、 抽样与抽样分布 参数估计基本方法 总体均值和总体比例的区间估计 两个总体均值及两个总体比例之差的估计 正态总体方差及两正态总体方差比的区间 估计
s s
2 1 2 2
2 1 2
P 1P 2

2 1
2 2
如果现在睡觉, 你会做梦; 如果现在学习, 你将会圆梦。
点估计
点估计
(概念要点)
1. 从总体中抽取一个样本,根据该样本的统计 量对总体的未知参数作出一个数值点的估计
例如: 用样本均值作为总体未知均值的估计值 就是一个点估计
式中:M为样本数目 比较及结论:1. 样本均值的均值(数学期望)等于总体均值
2. 样本均值的方差等于总体方差的1/n
样本均值的分布与总体分布的比较
总体分布
.3
P(x)
抽样分布
.3 .2 .1 0
.2 .1 0
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
= 2.5
σ2 =1.25
总体
不同容量样本的抽样分布
n=1 n=4 n=10
简单随机样本


计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
2
2值
均值的标准误
1. 所有可能的样本均值的标准差,测度所 有样本均值的离散程度
2. 小于总体标准差 3. 计算公式为
x n
两个样本方差比的抽样分布
总体均值的区间估计
(2已知)
总体均值的置信区间
(2 已知)
1. 假定条件

总体服从正态分布,且总体方差(2)已知 如果不是正态分布,可以由正态分布来近似 (n 30)
2. 使用正态分布统计量Z x Z ~ N (0,1) n 3. 总体均值 在1-置信水平下的置信区间为 , x Z 2 x Z 2 n n
2 sx 12 2 2 ~ F (n1 1, n2 1) sy 2
s
2 y 2 2
将F(n1-1 , n2-1 )称为第一自由度为(n1-1),第二 自由度为(n2-1)的F分布
两个样本方差比的抽样分布
不同样本容量的抽样分布
(1,10) (5,10) (10,10)
F
T 统计量的分布
.2 .3 P(x)
.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
所有样本均值的均值和方差
1.0 1.5 4.0 x 2.5 M 16
i 1
n
x
i 1
n
i
2 x
2 ( x ) i x
M (1.0 2.5) 2 (4.0 2.5) 2 2 0.625 16 n
相关主题