第三章 样本均数的抽样误差与置信区间 ★ 联系:3.1 样本均数的分布·从同一总体中独立抽取多份样本, 他们的均数常大小不一, 这说明样本均数存在变异。
通过电脑实验来认识样本均数的变异规律一、正态总体样本均数的分布实验 3.1 从正态分布总体抽样的实验 假定正常男子的红血球计数服从正态分布N(4.6602, 0.57462),随机抽取1000份样本, 每份含n =5个个体。
样本均数依然是一个随机变量, 且(1)(2)(3) 样本均数的分布很有规律,围绕着总体均数,中间多、两边少, 左右基本对称(对称、正态?);(4)(5) 随着样本量的增大,表3.1 从N(4.6602, 0.57462)中随机抽样, 样本量为5, 100份独立 12图3.1 从正态分布总体抽样的实验结果 23.7 4.1 4.5 4.9 5.3 5.7 3.7 4.1 4.5 4.9 5.3 5.7 3.7 4.1 4.5 4.9 5.3 5.7(a) (b) (c)* 由这份样本估计的95%置信区间实际上并未复盖总体均数表3.2 从N(4.6602, 0.57462)中随机抽取1000份独立样本, 其均数的频数分布组段下限(1012 /L) 频数 频率(%) 累积频率(%)3.60- 1 0.1 0.13.80- 5 0.5 0.64.00- 32 3.2 3.84.20- 117 11.7 15.54.40- 229 22.9 38.44.60- 304 30.4 68.84.80- 218 21.8 90.65.00- 76 7.6 98.25.20- 15 1.5 99.75.40- 3 0.3 100.0合计 1000 100.0·理论上可以证明, 从正态分布N(μ, σ2)的总体中随机抽取含量为n 的样本,其样本均数X ~N(μ, σ2 /n)。
·样本均数的标准差习惯上又称为样本均数的标准误(standard error),简称标准误。
值得注意的是如下的普遍规律:或 ·实际应用中往往总体标准差σ未知, 人们只能用样本标准差S 代替σ,从而获得x σ的估计值x S ,则有·为方便计,可称x σ为理论标准误,x S 为样本标准误。
二、非正态总体样本均数的分布实验3.2 从正偏峰的分布总体抽样的实验(1) 随着样本量的增大, 样本均数分布的对称性逐渐改善, 样本量为30时, 样本均数的分布接近正态分布;(2) 随着样本量的增大, 样本均数的变异范围逐渐变窄。
实验3.3 从不对称钩形分布的总体抽样的实验 图3.3(a):(1) 样本均数分布再不象个钩子, 样本量很小时就象正态分布了;(2) 随着样本量的增大, 样本均数的变异范围也逐渐变窄。
·以上两项实验的结果具有普遍性。
理论上可以证明, 非正态总体样本均数的分布并不是正态分布;但当样本量较大时(例如,n ≥30), 样本均数的分布接近正态分布3.2 t 分布一、标准正态离差和标准t 离差·标准正态离差便服从标准正态分布, 记为1 2 3 4 5 7 8 n=5 (b) 1 2 3 4 5 6 7 89(d) 1 2 3 4 5 67 8 9 (e) 图3.2 从正偏峰的分布总体分布抽样实验的结果 (a)是原分布,正偏峰;其它为不同样本含量时样本均数的直方图1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 n=5 (b) 1 2 3 4 5 6 7 8 9 n=10 (c) 1 2 3 4 5 6 7 8 9 n=20 (d) 1 2 3 4 5 6 7 8 9 n=30 (e) 图3.3 从不对称钩形分布总体抽样实验的结果 (a)是原分布,呈钩形;其它为不同样本含量时样本均数的直方图 1 2 3 4 5 6 7 8 9 (a)·若σ未知,用样本标准差S 代替σ,x S 以代替x σ它们不尽相同,即x S 有变异,因而x S X /)(μ-比x X σμ/)(-多了一种与自由度有关的变异。
W.S.Gosett 于1908年用笔名Student 研究了它的分布规律, 称之t 分布, 记为·x S X /)(μ-不妨称为标准t 离差(standard t deviate)。
ν(读作nu[nju:])是t 分布的自由度,不同的自由度对应于不同的t 分布曲线。
二、t 分布的图形与t 分布表实验3.1(续) 标准正态离差和标准t 离差 对前述实验3.1所得1000份随机样本分别计算标准正态离差和标准t 离差, 并绘制相应的直方图, 如图3.4(a)和(b)所示。
·本书附表5给出了t 分布的双侧尾部面积和对应的t 界值。
对应于同样大小的尾部面积α,t 界值比正态分布界值要大。
3.3 正态分布总体均数的置信区间·95%置信区间:设N(μ, σ2 ), μ和σ未知,由t 分布面积规律可知: -t 0.05≤xS X μ-≤t 0.05 (3.3) ·经移项化简,可改写为x S t X 05.0-≤μ≤x S t X 05.0+ (3.4) 置信程度为95%;换言之,这样估计100次,约有95次正确。
·应用公式为·(1-α)置信区间:-5-3-10135(a )-5 -3 -1 0 1 3 5 (b ) 图3.4 从N(4.6602,0.57462)中随机抽取1000份独立样本,n=5 (a)样本均数的标准正态离差的直方图;(b)样本均数的标准t 离差的直方图 图3.5 标准正态分布和t 分布的图形 ν=∞时的t 分布即标准正态分布(x s t x α-, x s t x α+) (3.6) ·x s t α可称为置信区间的精度,它等于置信区间宽度的一半,意指置信区间的两端点离样本均数x 有多远。
实验 3.1(续) 置信区间与置信水平 对于前述从正态总体随机抽取的每一份样本均可按(3.5)式各计算总体均数μ的一个95%置信区间。
表3.1的第4列给出了由前100份样本作出的μ的95%置信区间。
不难发现, 多数区间(95个)覆盖了总体均数4.6602, 但第49, 75, 78, 81和89号这5个样本算出的区间却“扑空”了,即这样的区间估计95%正确,5%错误。
换言之,当我们依据一个样本均数,对总体均数只作一次区间估计时,其置信度为95%。
例 3.1 从某类患者中随机抽取20例, 其血沉(mm/h)的均数为9.15, 标准差为2.13。
假定该类患者的血沉值服从正态分布, 试估计总体均数的95%置信区间和99%置信区间。
解 x =9.15, s=2.13, n=20,20/)13.2(093.215.9/05.0±=±n s t x =10.15和8.15 20/)13.2(861.215.9/01.0±=±n s t x =10.51和7.78·置信水平由95%提高到99%, 置信区间便由窄变宽, 估计的精度下降。
若既要提高置信水平, 又要估计的精度好, 就必须缩小s 或加大n 。
s 反映客观存在的个体差异, 通常无法缩小, 但加大样本量是行之有效的办法。
3.4 两正态总体均数之差的置信区间·设有标准差相等而均数不等的两个正态总体N(μ1, σ2)和N(μ2, σ2),σ均未知。
·1X ~N(μ1,σ2/n 1), 2X ~N(μ2, σ2/n 2),1X -2X 仍服从正态分布(1X -2X )~N(μ1-μ2, σ2(1/n 1 +1/n 2 ))(3.7)·1X -2X 的标准正态离差服从标准正态分布, 即)/1/1()()(212121n n X X +---σμμ ~ N(0, 1) (3.8)·现σ2未知,服从t 分布。
即1X -2X 的标准t 离差 )/1/1()()(2122121n n S X X c +---μμ~ t 分布,v=n 1+n 2 (3.9)其中, S c 2称为两样本的合并方差:S c 2 =2-n n S 1)-(n S 1)-(n 21222211++ (3.10)S c 2的自由度为S 12和S 22的自由度之和, (n 1 -1)+(n 2 -1)= n 1+n 2-2, 因而, t 分布的自由度也是n 1+n 2-2。
·以下公式不讲解了:-t 0.05 ≤)/1/1()()(2122121n n S X X c +---μμ≤t 0.05 (3.11) )/1/1()(21205.021n n S t X X c +--≤21μμ-≤)/1/1()(21205.021n n S t X X c +--(3.12) ((1x -2x )-t 0.05)/1/1(212n n s c +,(1x -2x )+t 0.05)/1/1(212n n s c +)(3.13) ((1x -2x )-)/1/1(212n n s t c +α,(1x -2x )+)/1/1(212n n s t c +α)(3.14)例3.2 某地随机抽取40岁正常男子20名和40岁正常女子15名, 测定红细胞计数, 男女样本均数和样本标准差分别为1x =4.66, s 1 =0.47和2x =4.18, s 2 =0.45, 试计算40岁正常男女红细胞计数总体均数之差的95%置信区间。
(单位: 1012 /L) 解例3.3 假定某地健康成年男女的红细胞计数(1012 /L)分别服从均数不等、标准差相等的二个正态分布。
现有男女各一份随机样本, 样本量n 1=300, n 2=250, 均数和标准差分别为1x =4.66, s 1 =0.47和2x =4.18, s 2 =0.39。
试估计男女红细胞计数的总体均数之差的95%置信区间。
解3.5 二项分布总体概率以及概率之差的置信区间1. 二项分布总体概率的置信区间·大样本时,利用P 近似地服从正态分布的性质进行估计。
)/)1(,(~n p p p N P -(3.15) 其中,p 为样本频率。
利用(3.6)式, 我们有总体概率π的(1-α)置信区间为2. 二项分布总体概率之差的置信区间·21P P -也近似地服从正态分布, 即)/)1(/)1(,(~2221112121n p p n p p N P P -+---ππ(3.17) 其中p 1和p 2为样本频率的观察值。
据此, 总体概率之差π1-π2的(1-α)置信区间为22211121/)1(/)1()((n p p n p p z p p -+---α,)/)1(/)1()(22211121n p p n p p z p p -+-+-α (3.18) 例3.4 某医院将病情类似的病人随机分成两组。