当前位置：文档之家› 生物统计学3-抽样分布4-ok

生物统计学3-抽样分布4-ok

标准化的方法如下：
2
(n 1)s2
2
~
2 (n 1)
2服从自由度为n-1的卡方（chi-square）分布
2分布具有如下性质和特点：
1. 2分布的变量值始终为正； 2. 2分布的形状取决于其自由度的大小，通常为不对称的右偏分布，但随着自由度的增大逐渐趋于对称； 3. 对于 2 分布来说，抽出样本的总体必须是正态分布。
F
s12 s22
12
2 2
~ F (n1 1, n2 1)
F分布的临界值
临界值（上侧、下侧及双侧临界值表示同卡方分布）（见附表6）
附表6没有下侧临界值，可利用公式求出
F1 (df1, df2 )
1 F (df2, df1)
简便算法：求F值时，用较小方差作分母，较大方差作分子，采用上侧临界值。
2 2
பைடு நூலகம்
~
2 (n2
1)
两个独立的卡方分布除以自由度后相比即得到F分布，即
(n1 1)s12 / 12(n1 1)
(n2 1)s22 22(n2 1)
s12
/
2 1
s
2 2
/
2 2
~ F(n1 1,n2
1)
从均值和方差分别为
N (1,12 )
和
N
(2
,
2 2
)
的两个
正态总体中，抽取含量分别为n1和n2的样本，并分别求出它们的样本方差s12和s22，标准化的样本方差之比称为F。
t 分布的临界值
P(t t ) P(t t ) 此时，t 为上侧临界值，- t为下侧临界值；
P( t t ) 此时，t 为双侧临界值。
t 分布的图示跟正态分布十分相似。
注意：本教材中附表4给出的临界值均为双侧临界值，当使
用单侧临界值时需要注意。
<例2.28> 查表求 t0.05(9) ? ，t0.025(9) ?
(n1 1)s12 (n2 1)s22 ( 1
1
)
~ t(n1 n2 2)
n1 n2 2
n1 n2
其中
se2
(n1
1)s12 (n2 1)s22 n1 n2 2
为两样本的合并方差
s x1x2
se2
(
1 n1
1 n2
)
为样本平均数差数的标准误。
3.
方差比
s2 1
s22
的分布——F 分布
样本标准差s代替，这时标准化的样本均值
x 的抽样分布
x s
- 不
n
再服从标准正态分布，而服从具自由度为n-1的t分布，即：
t x - ~ t(n 1) sn
其中 s 称为样本标准误差，df n 1 称为自由度。
n
t 分布的密度曲线特点：
a）受df 制约，每个df 都有一条 t 分布密度曲线； b）以 y 轴为对称轴左右对称，且在t =0时取极大值； c）与标准正态分布比， t 分布曲线顶部略低，两尾部稍高而平， df 越大越趋近于标准正态分布。 d）一般当df >35时，t 值可由Φ值近似代替。
抽样分布
两个正态总体
均值
σ已知 σ未知
方差
均值差方差比
σ i已知
σ i未知但相等 σ i未知且不等
u分布 t分布 χ2分布 u分布 t分布
近似t分布
F分布
作业5
•习题2（P43）6、7
2分布的临界值
P( 2 2 )
2 ——上侧临界值
2 1
——下侧临界值
2
、 2 1-
——双侧临界值
2
2
例子：求 2 (9) ? 0.05 2 (9) 16.92 0.05
含义：自由度为9，概率α=0.05的 2值等于 16.92，就是说 2大于16.92的概率为0.05，或写成 P( 2 16.92) 0.05
与从单个总体抽样的情况类似。当总体标准差已知时，两个平均数差的分布对总体正态性的
要求并不十分严格，只要样本含量足够大就可以。当总体标准差未知时，两个总体应尽量为正态总体，如果不
能达到正态总体，也必须是近似正态总体。对于方差比的分布，要求抽出样本的两个总体必须是正态总
体。
本章小结
单个正态总体
即在大量重复抽样试验的基础上得到统计量取值的集合以及其相应的概率。
统计学的一个主要任务是研究总体和样本之间的关系，可从两个方面进行： ① 从总体到样本，即研究抽样分布的问题； ② 从样本到总体，即统计推断。
抽样分布是统计推断的基础。
设一个总体只有4个个体，即N=4，取值分别为x1=1，x2=2，x3=3， x4=4。具体可以视为一个黑布袋中有4个球，分别标明1,2,3,4号球，xi取每一个值的概率都相同，P(x)=0.25，总体的分布情况如图：
X的总体均值μ=21/6=3.5；各样本平均值与总体均值μ所表现的差异称为随机抽样误差。
由于随机误差（个体变异、抽样）的原因，抽取的各个样本所计算的统计量之间以及样本统计量与总体参数之间会存在一定的的差异，称为抽样误差。
我们从一个已知的总体中，独立随机地抽取含量为n的样本，研究所得样本的各统计量的概率分布，即所谓的抽样分布（sample distribution）；
第三章抽样分布
样本统计量本身是随机变量
例子：掷一枚均匀的骰子，并且令X为掷出的点数。假设骰子被掷3次，产生的样本观察值是 2,2,6 ，则此样本的均值是 3.33；现在再掷3次骰子并得到样本观察值3,4,6，这次样本的均值为4.33。
不同的样本会导致各样本的统计量取不同的值；
总体的分布总体的均值和方差为：
若从该总体中采取重复抽样的方法抽取容量为n=2的随机样本，即先摸出一个球，记下号码后放回袋中再摸第二个球，来看看样本均值的抽样分布。
从该总体中采取重复抽样的方法抽取容量为n=2的随机样本，共有42=16 个可能的样本，计算每一个样本的均值。
16个可能的样本及其均值与方差列表
2 1
2 2
n1 n2
当
12
2 2
2，n1
n2
n
时，
2 x1
x2
2 2
n
，而
2 x
2
n
表明：两样本平均数差数的抽样分布比平均数的分布分散得多。
2. i 未知但相等时，x1 - x2的分布
可以用
s12与
s22
代替
12和
2 2
，仿照单个总体的
t
分布：
t n1n2 2
( x1 x2 ) (1 2 )
， x1-x2
x1 x2
。
x1x2 是样本平均数差数的标准误。
可以证明：
1. i 已知时， x1 - x2 的分布
X1
~
N (1,12 )
，X 2
~
N
(
2
,
2 2
)
， x1 -
x2
~
N (1
2
,
2 1
n1
2 2
)
n2
则标准化后
u (x1 - x2 ) (1 2 ) ~ N (0,1)
解： t0.05(9) 2.262
t0.025(9) 2.685
2. 样本方差的抽样分布—— 2 分布
从正态总体中重复选取容量为n的样本时，由样本方差的所有
可能取值形成的抽样分布，称为样本方差的抽样分布。
在讨论样本方差的分布时，通常并不直接谈s2的分布，而是将
它标准化，并讨论标准化后的变量 2 的分布。
例：查表求
F0.01(4,20) ? F0.01(20,4) ? F0.99 (4,20) ?
解：
F0.01(4,20) 4.43
F0.01(20,4) 14.02
F0.99 (4,20)
1 F0.01 (20,4)
1 14.02
0.0714
注：从两个总体中抽取的样本统计量的分布，对总体分布的要求
样本均值经整理后的分布把的抽样分布绘成频数分布图：抽样分布的形成过程可以概括成下图：
一、从一个正态总体中抽取的样本统计量的分布
1. 样本平均数的抽样分布
1.1 u分布( z分布)
若随机变量X服从总体均值为μ，方差为σ2的正态分布，从该总体中独立随机地抽取含量为n的样本，样本均值的数学期望（即样
本均值的均值记为 x），样本均值的方差记为 x 2 ，则：
x
x
n
x 称为平均数 x 的标准误差（standard error of mean），简称标准误。
当 X ~ N(, 2) 时，x ~ N (, 2 ) ，则标准化后
n
u x ~ N (0,1) n
称为u分布（有的教材称为z分布）。
设 X1 ~ 2(n1) , X2 ~ 2(n2 ) , X1、X2 相互独立，则称
F
X1 X2
n1 n2
~ F (n1, n2 )
服从df =(n1，n2)的F分布，其中n1为第一自由度，n2为第二自由度。
样本方差的抽样分布服从卡方分布：
(n1 1)s12
2 1
~
2 (n1 1)
(n2 1)s22
二、从两个正态总体中抽取的样本统计量的分布
假定有两个正态总体 N (1,12)
，
N
(2
,
2 2
)
，从第一个总体随
机抽取含量为n1的样本，并独立地从第二个总体抽取含量为n2的
样本，然后计算样本平均数差数 x1 - x2，其所有可能取值形成的
分布称为样本平均数差数的抽样分布。

e商务文档

生物统计学3-抽样分布4-ok

相关文档推荐：