当前位置:文档之家› 03_1 抽样误差

03_1 抽样误差

11
均数的抽样误差之特点
• 各样本均数未必等于总体均数; • 样本均数间存在差异; • 样本均数的分布很有规律,围绕总体均
数,中间多两边少,左右基本对称; • 样本均数的变异范围较之原变量的变异范
围大大缩小; • 随着样本含量的增加,样本均数的变异范
围逐渐缩小。
2015/3/6
12
与样本含量的关系
MEDICAL STATISTICS 医学统计学
抽样误差及其规律性 Sampling variability and its attributes
柏建岭 南京医科大学公共卫生学院
生物统计学系
主要内容
抽样误差 模拟实验 标准误 中心极限定理 t分布 抽样误差规律性
2015/3/6
2
了解抽样误差规律的重要性
97
104 -0.6
99 98 100 95 97.8 1.7
95
100 -2.2
103 109 109 95 104.1 6.1
95
109 4.1
93 94 99 100 96.4 3.1
93
100 -3.6
104 105 90 106 101.2 6.4
90
106 1.2
104 92 103 83 95.6 8.6
总体
随机 抽样
同质个体、个体变异
样本
代表性、抽样误差
总体参数
未知
2015/3/6
样本统计量
统计 推断
已知
风险
3
抽样误差
• 假如事先知道某地七岁男童的平均身高为119.41cm。为了 估计七岁男童的平均身高(总体均数),研究者从所有符 合要求的七岁男童中每次抽取100人,共计抽取了三次。
μ=119.41cm σ= 4.38cm
• 样本统计量与总体参数间的差别 • 不同样本统计量间的差别
– 抽样误差是不可避免的! – 抽样误差是有规律的!
2015/3/6
5
模拟试验
• 假设一个已知总体,从该总体中抽样,对 每个样本计算样本统计量(均数、方差等), 观察样本统计量的分布规律--抽样分布 规律。
• 考察:
– 不同的分布 – 不同的样本含量
对统计量的影响。
2015/3/6
6
均数的模拟试验
• 从不同总体中进行抽样,观察均数的抽样分布规 律。 – 正态总体 – 偏三角分布总体 – 均匀分布总体 – 指数分布总体 – 双峰分布总体
• 考察:
– 样本均数的均数与总体均数有何关系?
– 样本均数的标准差与总体标准差有何关系?
– 样本均数的分布形状如何?
– 不同的样本含量对上述性质的影响如何?
2015/3/6
7
正态分布样本均数的分布
从N(100,62)中随机抽样,样本含量为4的 10份独立样本的 均数、标准差、抽样误差
样本 编号
1 2 3 4 5 6 7 8 9 10
2015/3/6
n=4
样本 均数
样本 标准差
最小值
最大值
抽样 误差
98 98 104 97 99.4 2.9
本的含量为n),可得无限多个样本,每个样 本计算样本均数,则样本均数也服从正态分 布。
– 样本均数的均数为 ;
– 样本均数的标准差为
X
n

2015/3/6
14
中心极限定理(central limit theorem)
Case 2:
从非正态(nonnormal)分布总体(均数为,方 差为2)中随机抽样(每个样本的含量为n),可
n=10
n=25
2015/3/6
Sampling Distribution of sample means
Sampling Distribution of sample means
Sampling Distribution of sample means
Sampling Distribution of sample means
120.0
Sample Mean
从N(100,62)中随机抽样,样本含量为4的
1000个样本均数的频数分布图
2015/3/6
10
Sampling distribution for means
n=2 n=4
X Population A
X Population B
X Population C
X Population D
• n 越大,均数的均数就越接近总体均数; • n 越大,变异越小,分布越窄; • 对称分布接近正态分布的速度,大于非对
称分布。分布越偏,接近正态分布所需样 本含量就越大。
2015/3/6
13
中心极限定理(central limit theorem)
Case 1:
从正态分布总体N(,2),中随机抽样(每个样
X
n
• 当总体标准差未知时,用样本标准差代替,
sX
s n
• 前者称为理论标准误,后者称为样本标准误。
2015/3/6
16
标准离散程度,体现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数,样本 率)的离散程度越大,即用样本统计量来直接估 计总体参数越不精确。反之亦然。
10 i 1
Xi
1 99.4
10
97.8
98.2
98.4
100
n
Xi X
sX
i 1
10 1
6 3
n4
99.4 98.42 98.2 98.42
2.82 10 1
2015/3/6
9
.15
样本均数服从正态分布
.1
.05
正态总体分布
0
80.0
90.0
100.0
110.0
83
104 -4.4
99 107 94 97 99.4 4.9
94
107 -0.6
100 103 96 92 97.9 4.1
92
103 -2.1
92 97 94 94 94.3 1.9
92
97 -5.7
100 102 95 97 98.2 2.8
95
102 -1.8
8
样本均数的均数和标准差
X
1 10
得无限多个样本,每个样本计算样本均数, 则只要样本含量足够大(n>50),样本均数也近 似服从正态分布。
– 样本均数的均数为 ;

样本均数的标准差为 X
n

2015/3/6
15
标准误(standard error)
• 样本统计量的标准差称为标准误。
• 样本均数的标准差称为均数的标准误。
• 均数的标准误表示样本均数的变异度。
X 118.21cm s=4.45cm
X 120.18cm s=4.90cm
X 120.81cm
s=4.33cm
2015/3/6
4
抽样误差
• sampling error,sampling variability
– 由抽样引起的样本统计量与总体参数间 的差别。
– 原因:个体变异+抽样 – 表现:
相关主题