当前位置：文档之家› 医学统计学抽样误差和t分布

医学统计学抽样误差和t分布

-4
-3
-2
-1
0
1
2
3
4
图3.2 自由度分别为1、5、∞时的t分布
t分布的特征
• t分布为一簇单峰分布曲线 • t分布以0为中心，左右对称
• t分布与自由度有关，自由度越小，t分布的峰越
低，而两侧尾部翘得越高，；自由度逐渐增大时， t分布逐渐逼近标准正态分布；当自由度为无穷大时，t分布就是标准正态分布。
四个非正态分布的总体抽样结果
（A偏三角分布、B均匀分布、C指数分布、D双峰分布）
• 图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上，任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。
标准差与标准误的联系和区别
• 联系
–都是变异指标。S反映个体观察值的变异；
• 样本均数的标准差称为标准误。此标准误与个体
变异成正比，与样本含量n的平方根成反比。
• 实际工作中，往往是未知的，一般可用样本标准差s
代替：
sX s n
• 因为标准差s随样本含量的增加而趋于稳定，故增加样
本含量可以降低抽样误差。
• 中心极限定理表明，即使从非正态总体中随机抽样，只要样本含量足够大，样本均数的分布也趋于正态分布，见图3.1 。
与 n 的关系 n →∞，s →
n →∞， s → 0 X
应用
表示观察值波动的大小
表示抽样误差的大小
用于计算变异系数
用于均数的假设检验
计算标准误
结合样本均数和正态分布的规律，结合样本均数和正态分布的规律，
估计参考值范围
估计参数的可信区间
t分布
• 设从正态分布N(, )中随机抽取含量为n的样本，样本均数
t分布的特征
• 每一自由度下的t分布曲线都有其自身分布规律
• t分布表明，从正态分布总体中随机抽取的样本，由样本计算的t值接近0的可能性较大，远离0的可能性较小。t0.05,10＝2.228，表明，从正态分布总体中抽取样本含量为n=11的样本，则由该样本计算的t值
大于等于2.228的概率为0.025，小于等于-2.228的概率亦为0.025。
和标准差分别为和s，设：
X
X X
t
sX
sn
• 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于
1908年在《生物统计》杂志上发表该论文时用的是笔名
“Student”，故t分布又称Student t分布。
f(t)
=∞（标准正态曲线）
=5
=1 0.3
0.2
0.1
P(t≤-2.228)+P(t≥2.228)＝0.05 或：P(-2.228<t<2.228)=1-0.05=0.95。
t , t0.05,10 2.228
-2.228
2.228
反映统计量的变异。 –当n不变时，标准差↑，标准误↑
s sX
n
区别
s
意义
描述原始数据的离散程度，
衡量均数对原始数据的代表性
计算
直接法、加权法
与均数的关系s 越小， X 对样本数据的代表性好
s X
反映抽样误差的大小，衡量样本均数估计总体均数的可靠性s
sX n
s X 越小， X 估计的可靠性大
3.抽样误差和 t 分布
Sampling error and t distribution
抽样误差的概念
• 由抽样引起的样本统计量与总体参数间的差异 • 两种表现形式
–样本统计量与总体参数间的差异 –样本统计量间的差异
抽样误差产生的条件
• 抽样研究 • 个体变异
均数的抽样误差及标准误
• 表现一：样本均数与总体均数之差值 • 表现二：多个样本均数间的离散度
中心极限定理(central limit theorem)
• 从均数为、标准差为的总体中独立随机抽样，
当样本含量n增加时，样本均数的分布将趋于正态
分布，此分布的均数为，标准差为x
X n标准误(来自tandard error，SE)
• 样本统计量的标准差称为标准误，用来衡量抽样误差的大小。

e商务文档

医学统计学抽样误差和t分布

相关文档推荐：