医学统计学 正态分布(精)
参考值范围的估计方法:正态分布法
2.5% 95% 2.5%
-1.96
+1.96
【例5.6 】某地调查正常成年男子144人的红细胞 数,近似正态分布,得均数 X =5.38×1012/L,
标准差S=0.44×1012/L。试估计该地成年男子红
细胞数的95%参考值范围。 解:双侧,95%界值u=1.96
X 2S 作为上下警戒值,
X 3S 作为上下控制值
4)正态分布是许多统计方法的理论基础
u 检验是以正态分布为理论基础的假设 检验方法; 统计学中的三大统计分布:卡方分布,t 分布, F 分布都是在正态分布的基础上推 导出来的; 某些分布的极限形式为正态分布:如 t 分 布,二项分布,Poisson分布等。均可按正 态近似的原理来处理。
应用本法的条件是样本含量较多,分布趋于稳定,样本含量 不少于150为宜。 其优点是可用于任何分布甚至分布不明的 资料。
【例5.7 】 用硫酸-高锰酸钾-硝酸消化法和无火焰原子吸 收光谱法测得某市238 名正常人发汞值如表5.6,试确定 该市发汞值的95%正常值范围。
表5.4 238例正常人发汞值的频数分布
X ±us
(cm)
人数
百分数(%)
(%)
────────────────────────────────────
X ±1.00s 119.41±1.00×4.38 X ±1.96s 119.41±1.96×4.38
115.03-123.79 110.83-127.99 108.11-130.71
83 113 119
参考值范围的涵义:绝大多数的正常人在该范围内 绝大多数,习惯上指正常人的80%,90%,95% (最常用)或99%等。 例如,根据正常人样本确定了血清谷草转氨酶正常 值单侧95%上限为37U/L。即容许有5%的正常人被 判为异常,称为假阳性
5.估计界值
即根据资料的分布类型,样本含量的多少及研究者 的要求,选用适当的方法,确定正常值范围的界值。
(2)制定参考值范围的方法
1. 正态分布法 : 用本法的条件是资料服从正态分布,样本均数和标 准差趋于稳定,样本含量不少于50为宜。亦可用 于经变量变换后服从正态分布的资料,如对数正 态分布。 估计公式: X us
表5.2 常用 u 值表 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 参考值范围(%) 单侧 双侧 ──────────────────────────── 80 0.842 1.282 90 1.282 1.645 95 1.645 1.960 99 2.326 2.576 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━
围7岁男童人数占该组儿童总数的实际百分数,说明与
理论百分数是否相近。
1) 按式(5.2)求u :
110 119 .41 u 2.15 4.38
查附表1,得0.0158,即该地7岁男童身高在110cm以下者,估计约 占1.58%
2) 计算结果见表5.1
表 5.1 120 名 7 岁男童身高的实际分布与理论分布比较 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 身高范围 实际分布 理论分布 ───────
谢谢大家,再见
正常人:并不是指机体的任何器官、组织的形态和 机能都是正常的人,而是指排除了影响所研究指 标的疾病和有关因素的人
例数过少,代表性差;例数过多增加成本,且易导 致正常标准把握不严,影响数据的可靠性。
一般认为每组100例以上 ;有人认为确定临床生化
指标的正常值应取300-500例
2.对选定的正常人进行准确而统一的测定
2
X ,S
2 2
2
变量近似服从均数为 X, 方差为 S 的正态分布
【例5.5】 在例2.1中,某地120名7岁男童的身高,已
知均数 X =119.41cm,标准差S =4.38cm, (1)试估计
该地7岁男童身高在110cm以下者占该地7岁男童总数的
百分数。(2)分别求 X±1s,X ±1.96s, X±2.58s范
下限为 X -1.960s = 5.38-1.960(0.44) =4.52(1012/L) 上限为 X +1.960s = 5.38+1.960(0.44) =6.24(1012/L)
2. 百分位数法 根据正常人样本,计算选定的百分范围所对应的百 分位数
表5.3 常用正常值范围所对应的百分位数 Px ━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 单侧 双侧 参考值范围 (%) ───────── ───────── 下限 上限 下限 上限 ──────────────────────────── 80 P20 P80 P10 P90 90 P10 P90 P5 P95 95 P5 P95 P2.5 P97.5 99 P1 P99 P0.5 P99.5 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━ 发汞值 频数 累计频数 累计频率 (μg/g) f Σf (%) ──────────────────────── 0.3~ 20 20 8.4 0.7~ 66 86 36.1 1.1~ 60 146 61.3 1.5~ 48 194 81.5 1.9~ 18 212 89.1 2.3~ 16 228 95.8 2.7~ 6 234 98.3 3.1~ 1 235 98.7 3.5~ 0 235 98.7 3.9~4.3 3 238 100.0 ━━━━━━━━━━━━━━━━━━━━━━━━
保证原始资料可靠,是确定正常值范围的前提
3.决定取单侧范围值还是双侧范围值
正常值范围是取单侧还是双侧需根据指标的实际用 途来确定 过低和过高均属异常,需要分别确定下限和上限: 双侧范围。例如:白细胞总数 过高为异常,只需确定其上限,如:尿铅 仅过低为异常,只需确定其下限:如肺活量、智商
4.选定适当的百分范围
解:发汞值过高为异常,故取单侧95%上限
P95 2.3
0.4 238 95% 212 2.65( g / ) 16
3) 质量控制
变量的值落在区间 1.96 , 1.96 外的概率为0.05 变量的值落在区间 2.58 , 2.58 外的概率为0.01
5.2.4
正态分布的应用
1)概括估计变量值的频数分布 某些医学现象服从正态分布或近似服从正态 分布 如:同性别、同年龄儿童的身高,同性别健康 成人的红细胞数,血红蛋白量,脉搏数等, 以及实验中的试验误差等。
对正态分布的资料,只要求得均数和标准差, 便可以就其频数分布做出大概估计
N( , )
现代医学对正常值的概念有了较大的发展 : 如卫生学上对食品、空气、水、化妆品等的卫生标 准的制订 ;流行病学中某传染病隔离期限的确定; 在儿少卫生中不同性别、年龄儿童的各项生长发育 指标的等级标准的确定;动物实验中标准动物的确 定等等;
(1)确定正常值范围的一般原则和步骤
1.抽取足够例数的正常人样本
如环境中某些有害物质的浓度,食品中某些药物的残留量, 某些临床检验结果,某些疾病的潜伏期以及医院病人住院天 数等,都呈偏态分布,不便作统计处理,常在施以对数变换 后,如果能转换为正态分布,亦可按正态分布规律处理。
2)制定参考值范围
参考值范围,又称正常值范围, 是指绝大多数正 常人的某指标范围。 它来源于临床上对疾病诊断和治疗的实际需要,系 指正常人的解剖、生理、生化等各项指标观察值的 波动范围。 同为正常人的观测值因人、因时而异,因此不能将 某人某时的观察值作为正常值,而必须确定一个波 动范围
69.17 94.17 99.17
68.27 95.00 99.00
X ±2.58s 119.41±2.58×4.38
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
图5.6 某地120名7岁男童身高的实际频数分布与正态理论分布比较
很多医学资料是呈偏态分布的,有的经过变量变换 可转换为正态分布