第五章 参数估计基础一、样本均数的抽样分布与抽样误差
内 容
1. 抽样误差和抽样分布
2. 样本均数抽样分布和抽样误差
1. 抽样误差和抽样分布
n误差泛指实测值和真实值之差。
按其产生原因与性质分两 大类:系统误差和随机误差。
抽样误差是一种随机误差。
n抽样误差
由于生物固有的个体变异,从某一总体中随机抽取一个样 本,所得样本统计量与相应总体参数往往是有差异的,这种 差异称为抽样误差(sampling error)。
n误差产生的原因
n系统误差:由受试对象、研究者、仪器设备、研究方法等确定性 原因造成,有倾向性,可避免。
n随机误差:由多种无法控制的偶然因素引起的,无倾向性,不可 避免。
n抽样误差:产生的根本原因是个体变异、产生的直接原因是抽
样。
n抽样分布
n由于抽样误差存在,从同一总体中随机抽取若干份样本, 所得样本统计量是不一致的,差异无法避免但其存在一定
的分布规律。
n 正态分布总体样本均数抽样分布的电脑试验
n
假定某年某地所有13岁女生的身高服从总体均数为155.4 cm ,总 体标准差为5.3cm 的正态分布 。
用计算机从该总体中 随机抽样,每次抽取30例组成一份样本,重复抽样100次,计算 每份样本的平均身高。
(
) 2 155.4,5.3 N 2. 样本均数抽样分布和抽样误差
n电脑试验表明,正态分布总体样本均数抽样分布具有以 下特点:
n样本均数恰好等于总体均数极其罕见;
n样本均数之间存在差异;
n样本均数围绕总体均数,中间多、两边少,左右基本对称,呈 近似正态分布;
n样本均数间的变异小于原始变量值间的变异。
PERCENT
30
x MIDPOINT
0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0
n 非正态分布总体样本均数抽样分布的电脑实验
n
图 (a ) 是正偏峰分布原始数据对应的直方图,用计算机随机抽取 样本量分别为5, 10, 30和50的样本各1000份,计算样本均数并绘 制4个直方图。
(a ) 原始数据
n =5
P E RC E N T
30
m m MI D P O I NT
0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0
n=10
PERCENT
30
mm MIDPOINT
0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0
n=30
PERCENT
30
mm MIDPOINT
0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0
n=50
PERCENT
30
mm MIDPOINT
0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0
(d ) n =30 (e ) n =50
(b ) n =5 (c ) n =10
n 中心极限定理表明
n
从正态总体 中随机抽取例数为 n 的多个样本,样本均数
服从正态分布;即使是从偏态总体中随机抽样,当 n 足够大时(如 n >30),样本均数也近似正态分布,且样本均数的均数等于原分 布的均数。
( ) 2
, N m s
n均数抽样误差
n由固然存在的个体变异和抽样造成的样本均数与样本均数 及样本均数与总体均数之间的差异称为均数的抽样误差。
小 结
1. 抽样分布和抽样误差
n样本统计量抽样分布
n误差含义及误差产生原因
2. 样本均数抽样分布和抽样误差
n正态分布总体样本均数抽样分布规律
n非正态分布总体样本均数抽样分布规律。