当前位置:文档之家› 抽样误差与假设检验.pptx

抽样误差与假设检验.pptx

S S 0.38 0.032(1012 / L) X n 140
标准误的用途: 标准误是抽样分布的重要特征之一,可用于衡量抽 样误差的大小,更重要的是可以用于参数的区间估 计和对不同组之间的参数进行比较。
标准差与标准误的区别与联系
意义
标准差:描述个体值间的变异,标准差较 小,表示观察值围绕均数的波动较小。 说明样本均数的代表性。
假定某年某地所有13岁女学生身高服从
N(155.4,5.32),在该总体中作100次随
机抽样,ni = 30
总体
样本n1 样本n2
样本nk
样本均数
X1
153.6
X2
153.1
····
Xk 157.7
各样本均数不相同,为什么?
从正态总体N(155.4,5.32)抽样得到的100个样本均数的频数分布
抽样分布
抽样分布示意图
三、标准误(Standard Error)
样本均数的标准差称为标准误。样本均数的变
异越小说明估计越精确,因此可以用标准误表示
抽样误差的大小:
X
n
实际中总体标准差 往往未知,故只能求得样 本均数标准误的估计值 : S
X
S
S
X
n
例4.1 在某地随机抽查成年男子140人,计算 得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误。
第四章 抽样误差与假设检验
要求:
掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及
其与参考值范围的区别。
了解:t变换。
第一节 均数的抽样误差与标准误
一、均数的抽样误差
在医学研究中,绝大多数情况是由样本信息研究 总体。由于个体存在差异,因此通过样本推论总体 时会存在一定的误差,如样本均数 往X往不等于总 体均数 ,这种由抽样造成的样本均数与总体均数 的差异称为抽样误差。对于抽样研究,抽样误差不 可避免。
标准误:描述统计量的抽样误差,标准误 较小,表示样本统计量与参数较 接近。说明样本均数的可靠性。
标准差与标准误的区别与联系
区别
标准差:表示变量值离散程度的大小, 结合均数估计参考值范围。 随样本含量的增多,逐渐趋于稳定。
标准误:表示抽样误差的大小, 估计参数的可信区间。 随样本含量的增多逐渐减小。
100.0
二、抽样误差的分布
理论上可以证明:若从正态总体 N(, 2) 中,反 复多次随机抽取样本含量固定为n 的样本,那么 这些样本均数 X 也服从正态分布,即 X 的总体均 数仍为,样本均数的标准差为 / n 。
抽样分布
抽样分布示意图
中心极限定理: 当样本含量很大的情况下,无论原始测量变量服从 什么分布, 的X抽样分布均近似正态。
24
1.711 2.064 2.492 2.797
25
1.708 2.060 2.485 2.787
2①6 自由度1相.7同06时,2│.0t5│6值越2.4大79,概2率.77P9越小;
2②7 t值相同1.时70,3 t0.025/.20,2522= t02.0.2457,223=2.20.7747。1
第二节 总体均数的估计
一、可信区间的概念(Confidence Interval)
参数估计
点估计:不考虑抽样误差,如 X 区间估计:考虑抽样误差
Parameter estimation
point estimation interval estimation
总体均数的估计
1. 点(值)估计(point estimation): 用样本统计量直接作为总体参数的估
计值。
例 为了解某地1岁婴儿的血红蛋白浓度, 从该地随机抽取1岁婴儿25人,测得血红蛋 白的平均数为123.7g/L,标准差为 11.98g/L。试估计该地1岁婴儿血红蛋白 的平均 浓度。
2. 区间估计(interval estimation):
指按预先给定的概率,计算出一个区间, 使它能够包含未知的总体均数。事先给定的概率
2. t 分布只有一个参数ν,曲线形状与样本 含量有关。是一簇曲线。
f (t) v 标准正态分布 v5 v 1
图4-2 不同自由度的 t 分布图
3. 当自由度逼近∞,t分布则逼近u分布, 故标准正态分布是t分布的特例。
f (t) v 标准正态分布 v5 v 1
图4-2 不同自由度的 t 分布图
1 称为可信度,通常取 1 0.95
可信度(置信率、置信度): 由样本信息推断总体特征时,估计正确的概
率,用1-α表示。
α: Ⅰ类错误的概率
可信区间(confidence interval CI): 按预先给定的概率确定的包含未知总
体参数的可能范围。
可信限(confidence limit CL): 构成可信区间的两个点值 上限值:较大的值 下限值:较小的值
4. t分布曲线下的面积为1(100%)。
t界值表
概率P 自由度 双侧 0.10 0.05 0.02 0.01 ν 单侧 0.05 0.025 0.01 0.005
21
1.721 2.080 2.518 2.831
22
1.717 2.074 2.508 2.819
23
1.714 2.069 2.500 2.807
标准差与标准误的区别与联系
联系
(1)标准差与标准误都是变异指标,说 明个体值之间的差异时用标准差,说明统 计量之间的差异时用标准误。 (2)当样本含量不变时,标准差越大, 标准误亦越大。
t 分布
中心极限定理
总体
n 100
X ~ N(, 2)
样本均数 X ~ N(, X 2)
变量变换 u X
组段(cm) 152.6~ 153.2~ 153.8~ 154.4~ 155.0~ 155.6~ 156.2~ 156.8~ 157.4~
158.0~158.6 合计
频数 1 4 4 22 25 21 17 3 2 1
100
频率(%) 1.0 4.0 4.0 22.0 25.0 21.0 17.0 3.0 2.0 1.0
标准正态分布
u ~ N (0,1)
变量变换
X 未知
u
X
X
t s
X
服从自由度 = n 1的t分布
f (t) v 标准正态分布 v5 v 1
图4-2 不同自由度的 t 分布图
1.单峰分布,以0为中心,左右两侧对称
f (t) v 标准正态分布 v5 v 1
图4-2 不同自由度的 t 分布图
相关主题