当前位置:文档之家› 正态分布与参考值范围估

正态分布与参考值范围估


f
f(x) x
f
F(x)
x- u=

f (u)
(u) u 0
f(x)
x
x-x u= s
大样本资料
一般正态分布N(,2)
标准正态分布N(0,1)
正态分布函数(密度函数)
f(x)= 2 e
1
-(x-)2/22
-∞<x<+∞ -∞<u<+∞
(u)=2
1
e
-u2/2
• 任何正态分布变量 x若作u变换(标准化变 换),即可得到标准正态分布变量u. x- u= • u称为标准正态变量或标准正态离差,表 示 x与的差相当于多少个标准差单位.
指定值时,横轴上相对的 u值称u界值,记为 u 。 有单侧和双侧之分。即P(︱u︱>u)=。
/2 -u 0
/2 +u
-u 0
常用的u值 u u0.1 u0.05 u0.01 单侧 1.282 1.645 2.33 双侧 1.645 1.96 2.58
120名成年男子RBC的实际分布与理论分布比较
• 例1:某地调查正常成年男子144人的红细
胞数,均数为5.38×1012/L, 标准差为0.44
×1012/L。适估计该地成年男子红细胞数的
95%参考值范围。
• 双侧95%参考值范围: x±1.96s
= 5.38±1.96×0.44=(4.52~6.24)×1012/L
• 例2:某市1974年为了解该地居民发汞的
几个特殊区间的面积 x u ±1 x±1s ±1 ±1.96 x±1.96s ±1.96 ±2.58 x±2.58s ±2.58
(u) 68.27% 95.00% 99.00%

查表注意:
1. 利用均数和标准差先对X做标准化变换, u=(x-x)/s x=x+us
2. 曲线下对称于0的区间,面积相等 3. 曲线下横轴上的总面积为1或100%
基础水平,调查了留住该市一年以上,
无汞作业接触史的健康居民238人的发汞
含量如下表,试估计该市居民发汞值的
95%参考值范围。
• 发汞值的分布为偏态分布,过高为不正 常,故求单侧95%的上限,用百分位数 法,即求P95
某市238名健康人发汞含量
发汞值(g/g ) 0.30.71.11.51.92.32.73.13.53.9-4.3 合计 人数 20 66 60 48 18 16 6 1 0 3 238 累积频数 累积频率(%) 20 86 146 194 212 228 234 235 235 238 8.40 36.13 61.34 81.51 89.08 95.80 98.32 98.74 98.74 100.00 100.00
解:已知X =3400,S=900 (低体重儿是指出生体重≤2500g) u=(x-x)/S=(2500-3400)/900=-1
P=(-1)=0.1587
该地低体重儿的出生概率为0.1587
求某部分面积所对应的变量值 (由P求u及x)
/2 -u 0 /2 +u -u 0
在正态分布曲线下,当双侧或单侧的尾部面积为
单侧 < P(1-)×100 或 > P×100
• 双侧95%参考值范围: P2.5~P97.5
• 单侧95%参考值范围:<P95 或 >P5
3.对数正态分布法(适于对数正态分布资料) (1-)的参考值范围: 双侧 :lg-1(xlgx±uslgx) 单侧 :< lg-1(xlgx+uslgx) 或 > lg-1(xlgx-uslgx)
•求两个变量值之间的面积,即概率 (由x求 u及P) 例:随机抽取某地120名成年男子,测红
细胞计数,得X =4.7168(×1012/L),
S=0.5665(×1012 /L)。求红数及所占比例。
解:已知X =4.7168, S=0.5665
X=4时,u=(x-x)/s=(4-4.7168)/0.5665=-1.265 X=5时,u=(x-x)/s =(5-4.7168)/0.5665=0.500 P=(0.5)-(-1.265)=(1-0.3085)-0.1029=0.5886 人数:120×0.5886=71 人
如:区间(2.58,∞)的面积=(-2.58)=0.005 区间(- ∞,2.58)的面积= (2.58)=1- (-2.58) P(︱u︱>1.96)=2 (-1.96)=0.05
P(︱u︱﹤2.58)=(+2.58)- (-2.58)=0.99
P(u<-1.645 或 u>1.645)= (-1.645)=0.05 P(u<-1 或 u>1)= (-1)=0.1587
(实际人数为70人)
•例:为了解某地低体重儿的出生概率,某医 师从该地随机抽取100名新生儿,测定他们的 平均体重为3400g ,标准差为900g。求: ①该地低体重儿的出生概率 ②分别求x±1s, x±1.96s, x±2.58s范围
内的新生儿占该地总出生新生儿数的百分比。
2500 3400
• 正态分布曲线下一定区间的面积
e 2 1 -u2/2 P= (u)=∫ ∞ 2 du e
u -
P=F(x)= ∫ -∞
x
1
-(x-)/22
dx
F(x)
x
(u)
标准正态分布曲线下的面积,(u)值
正态分布曲线下的面积分布规律
-1 68.27% +1 -1.96 95% +1.96 -2.58 +2.58 99%
i Px=L+ fm (n×x%-∑fL)
P95=2.3+ 16(238×95%-212)=2.65
该市健康居民发汞值得95%参考值范围应 小于2.65g/g
0.4
正常人
病人
漏诊 误诊
可根据实际需要调整1-的大小
敏感性(Se)就是真阳性率,试验的特异性(Sp)就是真阴性率 从临床角度考虑,(1-Se)就是漏诊率,(1-Sp)就是误诊率
正态分布与参考值范围估计
Normal distribution and estimation of reference range
(2 学时) 吴成秋 公共卫生学院卫生学教研室
•正态分布的概念:
资料的频数分布曲线略呈钟型,两头低, 中间高,左右完全对称,并永远不与横轴相交 的曲线,该曲线称为正态分布曲线。该资料称 为正态分布资料。这种分布称为正态分布,又 称Gauss分布(Gaussian distribution). 由于频数的总和等于100%或1,故横轴上曲线 下的面积等于100%或1。
参考值范围的估计方法
1.正态分布法(适于正态分布资料)
(1-)的参考值范围:
双侧 x±us
单侧 <(x+us)
或 >(x-us)
• 双侧95%参考值范围: x±1.96s
• 单侧95%参考值范围: <x+1.64s
或 >x-1.64s
2. 百分位数法(适于非正态分布资料) (1-)的参考值范围: 双侧 P/2×100~P(1- /2) ×100
x
RBC 范围
实际分布 理论分布 人数 % %
x±1.00s 4.15~5.28
83 69.17
68.27
95.00
x±1.96s 3.61~5.83 114 95.00
x±2.58s 3.26~6.18 120 100.00
99.00
从上表可以看出,120名成年男子的实际分布与理
论分布的百分数很接近,说明该120名成年男子的RBC分
正态分布的特征
1.正态分布在横轴上方均数处最高,正态分布以
均数为中心,左右对称
2.正态分布有两个参数:均数(位置参数),标 准差(变异度参数),一般用 N(,2)表示正态 分布,标准正态分布用 N(0,1) 表示。 3.曲线和横轴所围面积为1,正态分布曲线下面 积分布有一定规律。
正态分布曲线下面积的分布规律
•参考值范围估计的一般原则与步骤
1.确定研究总体,保证研究对象的同质性。
2.确定样本含量,一般 n>100.
3.确定单侧或双侧(根据专业知识确定)。
4.确定适当百分范围(1-)。常取95%,99%,80%, 90%等。
5.选定适当的统计方法 • 正态分布法:适用于正态分布资料 • 百分位数法:适用于偏态分布资料
布接近正态分布。实际分布与理论分布的百分数越接近, 资料越近似正态分布。
参考值范围估计
•参考值范围(rang of reference value)的概念: 医学参考值是指正常人的各种生理、生 化数据,组织或排泄物中各种成分的含量。 由于同质观察单位某项测定指标在一定范围 内波动。 正常人的这些指标值的波动范围, 称为参考值范围;也称正常值范围(range of normal value). 前者较合理。
相关主题