当前位置:文档之家› (精品)医学统计学课件:正态分布

(精品)医学统计学课件:正态分布

40
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
41
正常人与病人的数据分布重叠示意图(单侧)
假阴性率
正常人
病人
假阳性率
42
正常人与病人的数据分布重叠示意图(双侧)
假阴性率 病人
正常人
假阳性率
病人
43
参考值范围的估计方法:正态分布法
2.5%
-1.96
95%
2.5%
+1.96
等;
-1.64~ +1.64内面积为90%; -1.96~ +1.96内面积为95%; -2.58~ +2.58内面积为99%。
23
标准正态分布
标准正态分布(standard normal distribution)是均 数为0,标准差为1的正态分布。
记为N(0,1)。 标准正态分布是一条曲线。 概率密度函数:
(u) 1 eu2 2 2
(-∞< u <+∞)
24
正态分布转换为标准正态分布 若 X~N(,2),作变换:
u X
则u服从标准正态分布。 u称为标准正态离差(standard normal deviation)
25
μ-2σ μ-σ μ μ+σ μ+2σ
X~N(,2)
μ-2σ μ-σ μ μ+σ μ+2σ
Medical statistic 医学统计学
正态分布
Normal Distribution and it’s Applications
正态分布的重要性
❖ 医学上某些指标服从或近似服从正态分布; ❖ 很多统计方法是建立在正态分布基础上的; ❖ 很多其他分布的极限为正态分布。
2
主要内容(Content)
正态分布的概念及图形 正态分布的特征 正态分布曲线下面积的规律 标准正态分布 正态分布的应用 总结
3
频数分布图
4
正态分布的概念及图形
(a)
(b)
(c)
(d)
5
正态分布的概念及图形
Normal distribution Gauss发现 最早用于物理学、天文学 Gaussian distribution
(均数)和变异度参数(标准差)。 有些指标本身不服从正态分布,但经过变换之
后可以服从正态分布。 正态曲线下的面积分布有一定的规律。
12
பைடு நூலகம்
正态曲线下的面积规律
X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。
S(-, -X)
S( +X,)=S(-, -X)
13
正态曲线下的面积规律
对称区域面积相等。
33
参考值范围确定的原则
选定足够例数的同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 (one sided or two sided) 选择百分界值(90%,95%) 确定可疑范围
34
选定同质的正常人作为研究对象
➢ 同质 ➢ 正常 ➢ “足够数量”
44
参考值范围的估计方法:百分位数法
P2.5
P97.5
45
参考值范围的估计方法
标准正态分布的u界值表
百分比(%) 单侧
80
0.8424
双侧
1.2816
90
1.2816 1.6449
95
1.6449 1.9600
99
2.3263 2.5758
46
参考值范围的估计方法
方法
双侧 单侧下限 单侧上限
正态分布法 X u / 2 s X u s X u s
✓ 例数过少,代表性差;例数过多增加成本,且易导 致正常标准把握不严,影响数据的可靠性。
✓ 一般认为每组100例以上 ;有人认为确定临床生化指 标的正常值应取300~500例。
35
控制检测误差
➢ 通过人员培训、控制检测条件、重复测定等措 施,严格控制检测误差。
36
判断是否分组
➢ 组间差别是否有统计学意义并有临床意义? ➢ 各组的分布范围、高峰位置等是否基本一致?
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
15
正态曲线下的面积规律
1-S(- , +)=0.3174 1-S(-2 , +2)=0.0456 1-S(-3 , +3)=0.0026
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
16
正态曲线下的面积规律
u0
27
正态分布的应用
估计频数分布 确定临床参考值范围
28
估计频数分布
出生体重低于2500g为低体重儿,某市婴儿出 生体重均数3200g,标准差为s=350g。设该资 料服从正态分布,试求该地低体重儿占该地所 有出生婴儿的比例。
29
首先计算标准离差:
u 2500 3200 2 350
此可作为判断该地区成年女子血清总蛋白含量 正常与否的参考值。
48
总结
正态分布是描述个体变异的重要分布之一,也 是统计学理论中的重要分布之一;
正态分布是由两个参数决定:均数和标准差; 正态分布曲线下的面积是有规律的,且与标准
正态分布曲线下的面积对应(以标准正态离差 为单位)。
49
19
正态曲线下的面积规律
2.5%
95%
2.5%
-1.96
+1.96
20
正态曲线下的面积规律
90%
5%
5%
-1.64
+1.64
21
正态曲线下的面积规律
0.5%
-2.58
99%
0.5%
+2.58
22
正态曲线下的面积规律
正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相等; 对任意正态曲线,按标准差为单位,对应的面积相
37
单侧与双侧参考值范围
根据医学专业知识确定!
双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 ……
下限: 肺活量,IQ,
单侧下限---过低异常 单侧上限---过高异常 双侧---过高、过低均异常
异常 正常 单侧下限
正常 异常 单侧上限
异常
正常
异常
双侧下限 双侧上限
38
选择百分界值
17
X2=-σ2 X1=-σ1 X3=-σ3
2 1
0.1587 0.1587 0.1587
3
X3 X1 X2
18
正态曲线下的面积规律
正态分布的一个显著特点
其曲线下面积完全决定于以标准差为单位 从点X到µ的离差。
X 1 1 1
1
2 2 2
2
3 3 3 1
3
S(-, )=0.5 S(-, -1)=0.1587 S(-, -2)=0.0228 S(-, -3)=0.0013
S(-, )=1
S(-, +1)=0.8413 S(-, +2)=0.9772 S(-, +3)=0.9987
-3 -2 - + +2 +3
-4 -3 -2 -1 0 1 2 3 4
➢ 参考值范围的涵义:绝大多数的正常人在该范围内
习惯上将“绝大多数”定义为80%、90%、95%或99% 。 应根据研究目的、研究指标的性质、数据分布特征等情
况综合考虑百分界值的选择。
39
确定可疑范围
➢ 若病人与正常人的数据重叠较多的情况下,为避 免较大的假阳性和假阴性错误率,可设定可疑范 围。
查标准正态分布表: (-2)=0.0228
结果:估计低体重儿的比例为2.28%.
30
思考题
✓ 标准正态分布曲线下-2~2范围内的面积? ✓ 标准正态分布曲线下-2~1范围内的面积?
31
➢ P(-2<u<2)=1-2×P(u≤-2) =1-2 × 0.0228=0.9544
➢ P(-2<u<1)=1-P(u≤-2)-P(u≥1) =1- P(u≤-2)-P(u ≤-1) =1-0.0228-0.1587=0.8185
百分位数法 P2.5~P97.5
>P5
<P95
47
例:参考值范围的计算
某地调查了200名成年女子的平均血清总蛋白为 73.5(g/L),标准差3.9 (g/L),试估计该地成年女子血 清总蛋白95%的参考值范围。
95%参考值范围: 下限:X -1.96s=73.5-1.96×3.9=65.9(g/L) 上限:X +1.96s=73.5+1.96×3.9=81.1(g/L)
6
7
正态分布的概率密度函数
如果随机变量X的概率密度函数
f (X)
1
e
(
X 2 2
)2
2
为总体均数,为总体标准差
π为圆周率,e为自然对数的底
(-∞< X <+∞)
X为变量,代表横轴的数值,f(X)为纵轴数值。
则称X服从正态分布,记作X~N(,2),其中, 为分布 的均数, 为分布的标准差。
32
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。 什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。
确定参考值范围的意义:
用于判断正常与异常。
“正常人”的定义:
排除了影响所研究的指标的疾病和有关因素的同质 的人群。
相关主题