当前位置:
文档之家› 生物统计学3-抽样分布4-ok
生物统计学3-抽样分布4-ok
标准化的方法如下:
2
(n 1)s2
2
~
2 (n 1)
2服从自由度为n-1的卡方(chi-square)分布
2分布具有如下性质和特点:
1. 2分布的变量值始终为正; 2. 2分布的形状取决于其自由度 的大小,通常为不对称的右偏分 布,但随着自由度的增大逐渐趋 于对称; 3. 对于 2 分布来说,抽出样本的 总体必须是正态分布。
F
s12 s22
12
2 2
~ F (n1 1, n2 1)
F分布的临界值
临界值(上侧、下侧及双侧临 界值表示同卡方分布)(见附 表6)
附表6没有下侧临界值,可利用 公式求出
F1 (df1, df2 )
1 F (df2, df1)
简便算法:求F值时,用较小 方差作分母,较大方差作分子 ,采用上侧临界值。
2 2
பைடு நூலகம்
~
2 (n2
1)
两个独立的卡方分布除以自由度后相比即得到F分布,即
(n1 1)s12 / 12(n1 1)
(n2 1)s22 22(n2 1)
s12
/
2 1
s
2 2
/
2 2
~ F(n1 1,n2
1)
从均值和方差分别为
N (1,12 )
和
N
(2
,
2 2
)
的两个
正态总体中,抽取含量分别为n1和n2的样本,并分 别求出它们的样本方差s12和s22,标准化的样本方 差之比称为F。
t 分布的临界值
P(t t ) P(t t ) 此时,t 为上侧临界值,- t为下侧临界值;
P( t t ) 此时,t 为双侧临界值。
t 分布的图示跟正态分布十分相似。
注意:本教材中附表4给出的临界值均为双侧临界值,当使
用单侧临界值时需要注意。
<例2.28> 查表求 t0.05(9) ? ,t0.025(9) ?
(n1 1)s12 (n2 1)s22 ( 1
1
)
~ t(n1 n2 2)
n1 n2 2
n1 n2
其中
se2
(n1
1)s12 (n2 1)s22 n1 n2 2
为两样本的合并方差
s x1x2
se2
(
1 n1
1 n2
)
为样本平均数差数的标准误。
3.
方差比
s2 1
s22
的分布——F 分布
样本标准差s代替,这时标准化的样本均值
x 的抽样分布
x s
- 不
n
再服从标准正态分布,而服从具自由度为n-1的t分布,即:
t x - ~ t(n 1) sn
其中 s 称为样本标准误差,df n 1 称为自由度。
n
t 分布的密度曲线特点:
a)受df 制约,每个df 都有一条 t 分 布密度曲线; b)以 y 轴为对称轴左右对称,且在t =0时取极大值; c)与标准正态分布比, t 分布曲线 顶部略低,两尾部稍高而平, df 越 大越趋近于标准正态分布。 d)一般当df >35时,t 值可由Φ值近 似代替。
抽 样 分 布
两个正态总体
均值
σ已知 σ未知
方差
均值差 方差比
σ i已知
σ i未知但相等 σ i未知且不等
u分布 t分布 χ2分布 u分布 t分布
近似t分布
F分布
作业5
•习题2(P43)6、7
2分布的临界值
P( 2 2 )
2 ——上侧临界值
2 1
——下侧临界值
2
、 2 1-
——双侧临界值
2
2
例子:求 2 (9) ? 0.05 2 (9) 16.92 0.05
含义:自由度为9,概率α=0.05的 2值等于 16.92,就是说 2大于16.92的概率为0.05, 或写成 P( 2 16.92) 0.05
与从单个总体抽样的情况类似。 当总体标准差已知时,两个平均数差的分布对总体正态性的
要求并不十分严格,只要样本含量足够大就可以。 当总体标准差未知时,两个总体应尽量为正态总体,如果不
能达到正态总体,也必须是近似正态总体。 对于方差比的分布,要求抽出样本的两个总体必须是正态总
体。
本章小结
单个正态总体
即在大量重复抽样试验的基础上得到统计量取值的集合以及 其相应的概率。
统计学的一个主要任务是研究总体和样本之间的关系,可从两个 方面进行: ① 从总体到样本,即研究抽样分布的问题; ② 从样本到总体,即统计推断。
抽样分布是统计推断的基础。
设一个总体只有4个个体,即N=4,取值分别为x1=1,x2=2,x3=3, x4=4。具体可以视为一个黑布袋中有4个球,分别标明1,2,3,4号球,xi取 每一个值的概率都相同,P(x)=0.25,总体的分布情况如图:
X的总体均值μ=21/6=3.5;各样本平均值与 总体均值μ所表现的差异称为随机抽样误 差。
由于随机误差(个体变异、抽样)的原因,抽取的各个样本所计算的 统计量之间以及样本统计量与总体参数之间会存在一定的的差异,称 为抽样误差。
我们从一个已知的总体中,独立随机地抽取含量为n的样本, 研究所得样本的各统计量的概率分布,即所谓的抽样分布 (sample distribution);
第三章 抽样分布
样本统计量本身 是随机变量
例子:掷一枚均匀的骰子,并且令X为掷 出的点数。假设骰子被掷3次,产生的样 本 观 察 值 是 2,2,6 , 则 此 样 本 的 均 值 是 3.33;现在再掷3次骰子并得到样本观察 值3,4,6,这次样本的均值为4.33。
不同的样本会导致各样本的统计量取不同 的值;
总体的分布 总体的均值和方差为:
若从该总体中采取重复抽样的方法抽取容量为n=2的随机样本,即先摸 出一个球,记下号码后放回袋中再摸第二个球,来看看样本均值 的抽 样分布。
从该总体中采取重复抽样的方法抽取容量为n=2的随机样本,共有42=16 个可能的样本,计算每一个样本的均值 。
16个可能的样本及其均值与方差列表
2 1
2 2
n1 n2
当
12
2 2
2,n1
n2
n
时,
2 x1
x2
2 2
n
,而
2 x
2
n
表明:两样本平均数差数的抽样分布比平均数的分布分散 得多。
2. i 未知但相等时,x1 - x2的分布
可以用
s12与
s22
代替
12和
2 2
,仿照单个总体的
t
分布:
t n1n2 2
( x1 x2 ) (1 2 )
, x1-x2
x1 x2
。
x1x2 是样本平均数差数的标准误。
可以证明:
1. i 已知时, x1 - x2 的分布
X1
~
N (1,12 )
,X 2
~
N
(
2
,
2 2
)
, x1 -
x2
~
N (1
2
,
2 1
n1
2 2
)
n2
则标准化后
u (x1 - x2 ) (1 2 ) ~ N (0,1)
解: t0.05(9) 2.262
t0.025(9) 2.685
2. 样本方差的抽样分布—— 2 分布
从正态总体中重复选取容量为n的样本时,由样本方差的所有
可能取值形成的抽样分布,称为样本方差的抽样分布。
在讨论样本方差的分布时,通常并不直接谈s2的分布,而是将
它标准化,并讨论标准化后的变量 2 的分布。
例:查表求
F0.01(4,20) ? F0.01(20,4) ? F0.99 (4,20) ?
解:
F0.01(4,20) 4.43
F0.01(20,4) 14.02
F0.99 (4,20)
1 F0.01 (20,4)
1 14.02
0.0714
注: 从两个总体中抽取的样本统计量的分布,对总体分布的要求
样本均值经整理后的分布 把 的抽样分布绘成频数分布图: 抽样分布的形成过程可以概括成下图:
一、从一个正态总体中抽取的样本统计量的分布
1. 样本平均数的抽样分布
1.1 u分布( z分布)
若随机变量X服从总体均值为μ,方差为σ2的正态分布,从该总体 中独立随机地抽取含量为n的样本,样本均值的数学期望(即样
本均值的均值记为 x),样本均值的方差记为 x 2 ,则:
x
x
n
x 称为平均数 x 的标准误差(standard error of mean),简称标准误。
当 X ~ N(, 2) 时,x ~ N (, 2 ) ,则标准化后
n
u x ~ N (0,1) n
称为u分布(有的教材称为z分布)。
设 X1 ~ 2(n1) , X2 ~ 2(n2 ) , X1、X2 相互独立,则称
F
X1 X2
n1 n2
~ F (n1, n2 )
服从df =(n1,n2)的F分布,其中n1为第一自由度,n2为第二自由度。
样本方差的抽样分布服从卡方分布:
(n1 1)s12
2 1
~
2 (n1 1)
(n2 1)s22
二、从两个正态总体中抽取的样本统计量的分布
假定有两个正态总体 N (1,12)
,
N
(2
,
2 2
)
,从第一个总体随
机抽取含量为n1的样本,并独立地从第二个总体抽取含量为n2的
样本,然后计算样本平均数差数 x1 - x2,其所有可能取值形成的
分布称为样本平均数差数的抽样分布。