常用的三种抽样分布
常用的抽样分布
如果总体服从正态分布N(m,s2),
则从该正态总体中抽取样本,得到的
样本均数也服从正态分布,但该分布
为N(m,s2/n ),此时的方差是总 体的1/n倍,即有
mx m,
sx
s
n
中心极限定理
• 如果总体不是正态总体,但其均数和标
准差分别为μ和σ,则当样本含量n不断
增大时,样本均数的分布也趋近于正态
由度的大小有关。
自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分 布(标准正态分布);当趋于∞时,t分布即 为Z分布。
t 界值表
(P279,附表2)
问单侧t0.025,10 ?
f (t) ν=10的t分布图
✓ 举例:
t
1.812 -2.228
2.228
① 10,单 =0.05,t , t0.05,10 1.812 ,则有
单侧t0.05,9=1.833 双侧t0.01/2,9=3.250
=单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
三、 F 分布
令 2 (1) 和 2 ( 2 ) 分别为服从自由度为 1 和 2 的
独立变量的卡方分布,则称 F 2 (1) 1 服从分子自由度
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10, 2 10
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度
分子的自由度,υ1
υ2
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 58 由度为
2
的
F
2 ( 2 )
分布,记为
2
F~
F
(
1,
2
)
。
对于样本方差
s12
和
s
2 2
,自由度分别为
1
和
2
的
正态总体,因为有 1s12 s2
~
2
( 1 )
,
2s22 s2
~ 2 ( 2 ) ,
所以有 F
= s12 s22
~ F (1, 2 )
F分布的概率密度函数
F 分佈是為了紀念著名的統計學家R.A. Fisher(1890-1962)而得名。
3.84
(1.96)2
Z2 0.05/ 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
5.99
附表 3 中列出了各种自由度的上α分位点
对应的概率,如
2 0.05
(2)
5.99
。
对于正态总体,若总体均数μ未知,则由
数理统计知识可知: (n 1)S 2
s2
即 s2 s2
服从χ2 ( ) ,
由此可对方差的抽样误差进行假设检验。
χ2分布
f(χ2)
χ2
χ2分布曲线下的面积与概率
二、 t 分布(t-distribution)
随机变量X N(m,s2)
Z X m s
Z变换
标准正态分布
N(0,12)
均数 X
N (m,s 2 n)
Z X m
sn
标准正态分布
N(0,12)
Student t分布
t X m X m , v n 1 SS n SX
自由度:n-1
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图4-2 不同自由度下的t 分布图
t分布的特征
①以0为中心,左右对称的单峰分布;
②t分布曲线是一簇曲线,其形态变化与自
P(t 1.812) 0.05 或 P(t 1.812) 0.05
② 10,双 =0.05,t 2, t0.05/ 2,10 2.228 ,则有
P(t 2.228) P(t 2.228) 0.05 t t 0.10/ 2,30 0.05,30
t分布曲线下面积(附表2)
双侧t0.05/2,9=2.262 =单侧t0.025,9
• (4)检验统计量分布(或抽样分布)
包括:卡方分布,t分布,F分布等。 这些分布是卡方检验、t检验、方差分
析等假设检验的基础。
练习作业
实习册 1,2,3,4
每一个成功者都有一个开始。勇于开始,才能找到成
•
1、
功的路 。20.11.2920.11.29Sunday, November 29, 2020
成功源于不懈的努力,人生最大的敌人是自己怯懦
•
2、
。0 6:30:43 06:30:4 306:301 1/29/2 020 6:30:43 AM
每天只看目标,别老想障碍
•
3、
。20.1 1.2906: 30:430 6:30Nov -2029-Nov-20
宁愿辛苦一阵子,不要辛苦一辈子
•
4、
。06:3 0:4306: 30:430 6:30Sunday, November 29, 2020
分布,且其均数为μ,标准差为 s
n
• 不论总体的分布形式如何,只要样本含
量n足够大时,样本均数的分布就近似正
态分布 ,此称为中心极限定理。 (下章通过抽样实验证实)
常用的三种抽样分布
• 一、 2 分布
• 二、t分布 • 三、F 分布
均为连续型随
机变量分布,分布 只与自由度,即样 本含量有关
2 0.05(1)
18.51 19.00 19.16 19.25 19.30 19.33 2
98.49 99.00 99.17 99.25 99.30 99.33
4.24 3.39 2.99 2.76 2.60 2.49 25
7.77 5.57 4.68 4.18 3.85 3.63
F 分布曲线下面积与概率
小结
• (1)随机变量、概率分布、抽样分布 是统计学推断的基础。
• (2) 二项分布描述二项分类变量两种 观察结果的出现规律。泊松分布是二项 分布的特例,常用于事件发生率很小, 样本含量很大的情况。
• (3)正态分布是其他分布的极限分布, 许多统计方法的理论基础。不少医学 现象也服从正态分布或近似服从正态 分布。