当前位置:文档之家› 抽样分布与参数估计 PPT

抽样分布与参数估计 PPT


X
~
N
(,
2 X
)
11
样本个数 1800 1600 1400 1200 1000 800 600 400 200 0
均数的抽样分布——正态分布
1200
1000
800
n=5
600
400
200样本均数0来自n=10图1 从正态总体N(155.4,5.32)中 以n=5抽样时样本均数的分布
1200
1000
800
抽样分布与参数估计
主要内容
§ 4.1 均数的抽样误差与标准误 § 4.2 t 分布和总体均数的估计
2
在医学研究中,因受人、财、物、时等条件的 限制,研究者不可能对总体(无论是有限总体 还是无限总体)中的所有个体进行研究,只能 对总体中的部分个体(样本)进行研究,然后 用样本信息来推断总体特征。这种用样本信息 推断总体特征的研究方法为抽样研究。
4
1. 模拟试验
已知某市16岁女中学生的身高分布服从均 数μ 为155.4cm、标准差σ 为5.3 cm的正态 分布。
现以固定n =10从该总体中随机抽取100个 样本,求得100个样本均数,如表3-1。
5
表3-1 100个样本均数
154.4 155.1 155.8 156.2 156.9 157.7 158.4 155.5 153.8 151.5 152.4 153.7 154.1 154.9 155.3 155.8 155.5 156.2 157.9 156.6 153.6 152.2 153.3 154.3 154.6 155.3 155.6 155.5 156.3 158.5 159.6 157.6 156.7 156.1 155.4 155.1 154.8 153.9 153.2 153.4 155.9 156.5 157.2 158.8 155.2 152.2 152.8 153.5 153.6 152.9 156.4 157.1 158.6 155.5 154.6 154.2 153.5 153.7 156.3 155.7 156.6 157.3 157.8 159.2 157.4 155.3 155.6 154.6 154.2 152.6 154.5 153.4 154.3 156.5 153.1 154.1 153.6 155.7 159.8 156.1 153.3 154.4 155.2 156.8 158.2 156.4 155.2 154.3 156.7 155.6 154.5 155.9 154.7 155.8 154.7 155.7 155.4 155.6 154.8 155.4
样本均数 X 的分布仍服从正态分 布 N (, 2 )。
X
当样本含量 n 足够大时,即使从偏态分布总 体中以固定 n 抽样,其样本均数的分布也服 从正态分布。
9
155.4cm 5.3cm
X~ N (, 2 )
以固定 n 随机抽样
n足够大
轻度偏态
X
X 155.38cm 155.4cm
sX 1.71cm
600
n=20
400
200
0
图2 从正态总体N(155.4,5.32)中
以n=10抽 样 时 样 本 均 数 的
分布
900
800
700
600
500
n=30
400
300
200
100
0
图3 从正态总体N(155.4,5.32)中 以n=20 抽样时样本均数的分布
图4 从正态总体N(155.4,5.32)中 以n=30 抽样时样本均数的分布
误。
12
标准误
样本均数的标准差 :简称标准误,是衡 X
量均数抽样误差大小的指标。
计算公式:
X
n
(理论值)
S X
S n
(估计值)
如上例, 5.3 cm,n 10 ,则
X
n 1.68 cm ,计算结果与模拟试验
中样本均数的标准差1.71cm相近。
14
标准误的意义
由公式可见,当 n 固定时,标准误与标准差成正比, 即个体离散度越大,标准误越大;当标准差不变时, 标准误与样本含量的平方根成反比,即样本含量越
t 分布的概念 总体均数的估计:
点值估计 区间估计
15
一、t 分布
N(,2)
ux
正态分布
X
以固定样本含量n抽样 u x / n
N(,2/n)
抽样研究的目的是用样本信息推断总体特征, 即统计推断(statistical inference),包括总体参 数估计和假设检验两个重要内容。
3
§ 4.1 均数的抽样误差与标准误
由于变异的存在,抽样研究所造成的样本均 数 与总体均数的差异,以及各样本均数间的 差异 称为均数的抽样误差。 抽样误差在抽样研究中是不可避免的,但只要 严格遵循随机化原则进行抽样,抽样误差的大 小是可以估计的。 如何估计?可通过下面的模拟试验加以理解。
15
154
19
155
27
156
16
157
8
158
5
159160
3
合计
100
由频数表可看出这100个样本均数的分布仍服从 正态分布;对该资料计算均数和标准差,记为
X 155.38 155.4 cm,S 1.71 cm。 X 8
2. 中心极限定理
中心极限定理:
从正态分布总体 N (, 2 )中以固定 n 抽样时,
6
由表3-1可看出,这100个样本均数大小不 等,且绝大部分不等于总体均数155.4,此 为抽样误差造成的。
如何估计其抽样误差的大小? 把该100个均数看作为X,即100个观察值,
并编制成频数表,如表3-2。
7
表3-2 模拟实验的100个样本均数的频数分布
组段(cm)
频数
151
1
152
6
153
大,标准误越小,当 n ,即总体时,标准误
sX 0 (对总体而言,无抽样误差)。 标准误的意义:标准误小,表示抽样误差小,样本 均数的代表性好;反之,标准误大,表示抽样误差 大,样本均数的代表性差。 因此,在实际工作中,可通过适当增加样本含量和 减少观察值的离散程度来减少抽样误差。
14
§ 4 . 2 t 分布和总体均数的估计
11
3. 标准误
在原正态分布中, 为标准差,反映的是各
观察值 X 间变异的大小,即反映了个体间的 离散度。
在样本均数的正态分布中, X 为样本均数的
标准差(简称标准误),反映的是各样本均数 间变异的大小,即反映了均数(群体)间的离 散度。
故可用标准误来估计抽样误差的大小;也
就 是说,反映抽样误差大小的指标为标准
相关主题