当前位置:文档之家› 医学统计学抽样误差和t分布

医学统计学抽样误差和t分布


-4
-3
-2
-1
0
1
2
3
4
图3.2 自由度分别为1、5、∞时的t分布
t分布的特征
• t分布为一簇单峰分布曲线 • t分布以0为中心,左右对称
• t分布与自由度有关,自由度越小,t分布的峰越
低,而两侧尾部翘得越高,;自由度逐渐增大时, t分布逐渐逼近标准正态分布;当自由度为无穷大 时,t分布就是标准正态分布。
四个非正态分布的总体抽样结果
(A偏三角分布、B均匀分布、C指数分布、D双峰分布)
• 图3.1描述了来自不同总体的样本均数之抽样误差和 抽样分布规律。事实上,任何一个样本统计量均有其 分布。统计量的抽样分布规律是进行统计推断的理论 基础。
标准差与标准误的联系和区别
• 联系
–都是变异指标。S反映个体观察值的变异;
• 样本均数的标准差称为标准误。此标准误与个体
变异 成正比,与样本含量n的平方根成反比。
• 实际工作中, 往往是未知的,一般可用样本标准差s
代替 :
sX s n
• 因为标准差s随样本含量的增加而趋于稳定,故增加样
本含量可以降低抽样误差。
• 中心极限定理表明,即使从非正态总体中随 机抽样,只要样本含量足够大,样本均数的 分布也趋于正态分布 ,见图3.1 。
与 n 的关系 n →∞,s →
n →∞, s → 0 X
应用
表示观察值波动的大小
表示抽样误差的大小
用于计算变异系数
用于均数的假设检验
计算标准误
结合样本均数和正态分布的规律, 结合样本均数和正态分布的规律,
估计参考值范围
估计参数的可信区间
t分布
• 设从正态分布N(, )中随机抽取含量为n的样本,样本均数
t分布的特征
• 每一自由度下的t分布曲线都有其自身分布规律
• t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接 近0的可能性较大,远离0的可能性较小。t0.05,10=2.228,表明,从 正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值
大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。
和标准差分别为 和s,设:
X
X X
t
sX
sn
• 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于
1908年在《生物统计》杂志上发表该论文时用的是笔名
“Student”,故t分布又称Student t分布。
f(t)
=∞(标准正态曲线)
=5
=1 0.3
0.2
0.1
P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228<t<2.228)=1-0.05=0.95。
t , t0.05,10 2.228
-2.228
2.228
反映统计量的变异。 –当n不变时,标准差↑,标准误↑
s sX
n
区别
s
意义
描述原始数据的离散程度,
衡量均数对原始数据的代表性
计算
直接法、加权法
与均数的关系s 越小, X 对样本数据的代表性好
s X
反映抽样误差的大小, 衡量样本均数估计总体均数的可靠 性s
sX n
s X 越小, X 估计的可靠性大
3.抽样误差和 t 分布
Sampling error and t distribution
抽样误差的概念
• 由抽样引起的样本统计量与总体参数间的差异 • 两种表现形式
–样本统计量与总体参数间的差异 –样本统计量间的差异
抽样误差产生的条件
• 抽样研究 • 个体变异
均数的抽样误差及标准误
• 表现一:样本均数与总体均数之差值 • 表现二:多个样本均数间的离散度
中心极限定理(central limit theorem)
• 从均数为、标准差为 的总体中独立随机抽样,
当样本含量n增加时,样本均数的分布将趋于正态
分布,此分布的均数为,标准差为x
X n标准误(来自tandard error,SE)
• 样本统计量的标准差称为标准误,用来衡量抽样 误差的大小。
相关主题