正态分布+参考值
1
正态分布
德莫佛最早发现了二项概 率的一个近似公式, 率的一个近似公式,这一公式 被认为是正态分布的首次露面 正态分布的首次露面. 被认为是正态分布的首次露面 正态分布在十九世纪前叶由 高斯加以推广, 高斯加以推广,所以通常称为高 斯分布. 斯分布.
德莫佛
2
正态分布
德国数学家Gauss发现 最早用于物理学、天文学 Gaussian distribution 1889年是高尔顿 (Francis Galton,1822-1911) 创先把该曲线称作正态曲线。
39
例题
例 某地抽查了样本含量较大的部分成年男 女的红细胞数,数据见表,试制定临床参 考值范围。
40
例题
某地正常成年男、女红细胞数( 表 某地正常成年男、女红细胞数(×1012/L) ) 性别 男 女
X
S 0.25 0.22
41
5 4.5
因正常成年男、女红细胞数有差别,故需分别 制定男、女红细胞数参考值范围 红细胞数呈正态分布,红细胞数过高过低都不 正常。 因此制定双侧95%参考值范围。
3
正态分布重要性
其一,医学研究中的某些观察指标服从或近 似服从正态分布; 其二,很多统计方法是建立在正态分布的基 础之上的; 其三,很多其他分布的极限为正态分布。
4
身高的分布
(a)
(b)
(c)
(d)
5
正态分布的概率密度函数
如果随机变量X的概率密度函数
f (X ) =
1
σ 2π
e
−
( X − µ )2 2σ 2
X ± us
X ±1.00s X ±1.96s X ±2.58s
身高范围(cm) 136.67~148.67 130.91~154.43 127.19~158.15
实际分布 人数 86 114 118 百分数(%) 71.67 95.00 98.33
理论分布(%) 68.27 95.00 99.00
16
标准正态分布
标准正态分布(standard normal distribution)是均 数为0,标准差为1的正态分布。 记为N(0,1)。 标准正态分布是一条曲线。 概率密度函数:
ϕ(X ) =
1 2π
e
− u2 2
(-∞< u <+∞)
17
正态分布转换为标准正态分布
若 X~N(µ,σ2),作变换:
20
总结
正态分布是描述个体变异的重要分布之一, 也是统计学理论中的重要分布之一; 正态分布是一簇分布,由两个参数决定:均 数和标准差; 正态分布曲线下的面积是有规律的,且与标 准正态分布曲线下的面积对应(以标准正态 离差为单位)。
21
正态分布的应用
估计频数分布 质量控制 确定临床参考值范围
22
估计频数分布
正态变量x转化为标准正态变量u,(公式 ☆ 正态变量x转化为标准正态变 u,(公式
u = X − µ
σ
)再用u值查表,得所求区间面积 再用u值查表,
占总面积的比例。 占总面积的比例
23
某项目研究婴儿的出生体重服从正态分布, 其 均 数 为 3150g , 标 准 差 为 350g 。 若 以 2500g作为低体重儿,试估计低体重儿的比 例。
双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 …… 下限: 肺活量,IQ,
单侧下限---过低异常 单侧下限 过低异常
异常 正常 单侧下限
单侧上限---过高异常 双侧---过高 过高、 单侧上限 过高异常 双侧 过高、过低均异常
正常 异常 正常 异常 双侧上限
34
异常
单侧上限
双侧下限
确定参考值范围的意义:
用于判断正常与异常。
“正常人”的定义:
排除了影响所研究的指标的疾病和有关因素的 同质的人群。
32
参考值范围确定的原则
选定同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 确定可疑范围
33
单侧与双侧参考值范围
根据医学专业知识确定!
u=
X −µ
σ
则u服从标准正态分布。 u称为标准正态离差(standard normal deviate)
18
正态分布转换为标准正态分布
实际应用中,经u变换后,就可把 求解任意一个正态分布曲线下面积的 问题,转化成标准正态分布曲线下相 应的面积问题。
19
标准正态分布曲线下面积Φ(u)
u
-3.0 -2.5 -2.0 -1.9 -1.6 -1.0 -0.5 0 0.00 -0.02 -0.04 -0.06 -0.08 0.0013 0.0013 0.0012 0.0011 0.0010 0.0062 0.0059 0.0055 0.0052 0.0049 0.0228 0.0217 0.0207 0.0197 0.0188 0.0287 0.0274 0.0262 0.0250 0.0239 0.0548 0.0526 0.0505 0.0485 0.0465 0.1587 0.1539 0.1492 0.1446 0.1401 0.3085 0.3015 0.2946 0.2877 0.2810 0.5000 0.4920 0.4840 0.4761 0.4681 u 0
47
48
正常人与病人的数据分布重叠示意图(单侧)
正常人 假阴性率 病人 假阳性率
35
正常人与病人的数据分布重叠示意图(单侧)
正常人 假阴性率 病人 假阳性率
36
正常人与病人的数据分布重叠示意图(双侧)
假阴性率 正常人
假阳性率
病人
病人
37
参考值范围的估计方法
方法 正态分布法 双侧 单侧下限 单侧上限
X ± uα / 2 s
(e表示常数 表示常数2.71828 ,-∞< X <+∞) 表示常数
则称X服从正态分布,记作X~N(µ,σ2),其中, µ为总体均数, σ 为总体标准差。
6
正态分布图示
.4
f(x)
.3
.2
.1
0
x
7
方差相等、均数µ不等的正态分布图示
µ3
µ1
µ2
8
均数相等、方差不等的正态分布图示
σ2 σ1 σ3 µ
44
45
频数表资料百分位数计算公式: 频数表资料百分位数计算公式
i为组距 为组距
i Px = L + (n × x% − ∑ f l ) fx
fx为Px所在组频数
Σfl 为 小于L 小于 各组段 的累计 频数
46
P95
2 = 11 + × (239 × 95% − 212 ) = 12.88(µmol / kg ) 16
S(-∞,-X)
S(X,∞)=S(-∞,-X)
µ
11
正态曲线下的面积规律
对称区域面积相等。
S(-x1, -x2)
S(x1,x2)=S(-x2,-x1)
-x1 -x2
µ
x2 x1
12
正态曲线下的面积规律
95% 2.5% 2.5%
µ-1.96σ
µ
µ+1.96σ
13
正态曲线下的面积规律
90% 5% 5%
25
估计频数分布
首先计算标准离差:
132.00 − 142.67 = −1.78 u= 6.00
查标准正态分布表: Φ (-1.78)=0.0375(3.75 : 0.0375(3.75 %) 结果:该地12岁男童身高在132cm以下者, 估计约占3.75%。
26
估计频数分布
表 2.7 120 名 12 岁男童身高的分布比较
µ-1.64σ
µ
µ+1.64σ
14
正态曲线下的面积规律
99% 0.5% 0.5%
µ-2.58σ
µ
µ+2.58σ
15
正态曲线下的面积规律
正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相 等; 对任意正态曲线,按标准差为单位,对应的面 积相等; µ-1.64σ~ µ+1.64σ内面积为90%; µ-1.96σ~ µ+1.96σ内面积为95%; µ-2.58σ~ µ+2.58σ内面积为99%。
M+3SD M+2SD
M
M-2SD M-3SD
1
2
3
4
5
6
7
8 9 10 11 12 13 14 15 取样时间
31
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。 什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。
正态分布及其应用
Normal distribution and its applications
:张旭辉 顾逸霏
Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University
27
质量控制
质量控制的意义
监控日常工作、科研过程、生产过程中误差的 变化,分析变化的趋原因,并及时采取措 施。
28
质量控制图(quality control chart)
M+3SD M+2SD M M-2SD M-3SD UCL (上控制限) UWL(上警戒限) CL (中心线) LWL(下警戒限) LCL (下控制限)
9
正态分布的特征