当前位置:文档之家› 1.5正态分布及其应用

1.5正态分布及其应用


概率-曲线下的面积
Pc X d ?
f(X)
cd
举例
Z .00 .01 .02 -0.3 .3821 .3783 .3745
-0.2 .4207 .4168 .4129
-0.1 .4602 .4562 .4522 0.0 .5000 .4960 .4920
Z 0 Z 1
.4168
0
Z = -0.21
对数组段 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~ 1.7~1.8 合计
频数 4 2 5 9 12 15 18 14 12 5 3 1 100
累计频数 4 6 11 20 32 47 65 79 91 96 99 100 —
• 根据经验已知正常成人的血铅含量 近似对数正态分布,因此,首先对 原始数据作对数变换,进行正态性 检验(p>0.50),并编制对数值频数 表,再利用正态分布法求95%参考 值范围。
• 即该地正常成人血铅含量95% 参考值范围小于38.28ug/dl。
摄取比值 人数
0.75~
1
0.80~
2
0.85~
13
0.90~
15
0.95~
26
1.00~
26
1.05~
18
1.10~
15
1.15~
3
1.20~1.25 1
• 例4. 某年某地测得120名20~50岁正 常成人血浆结合125碘-三碘甲腺原 氨酸树脂摄取比值的资料如下,试 估计95%参考值范围。
一、制定医学参考值范围 • 选定足够数量的同质“正常”人作为研究对象
如制定血清谷丙转氨酶参考值范围,“正常”人的条件是:1)无肝、 肾、心、脑、肌肉等疾病;2)近期未服用对肝脏有损伤的药物 (如氯丙嗪、异烟肼等);3)监测前未作剧烈运动。依据指标的 性质判断是否需要分组。
• 控制误差:严格控制随机误差 • 选择单双侧检验 • 选择适当的百分界值,95%常用 • 选择估计参考值范围的方法
• 同理, P(-2.58<u<2.58)=0.99 ,即x 取值在区间 μ2.58σ上的概率为99%。
2.5% 47.5% 47.5% 2.5%
-1.96 +1.96
0.5% 49.5% 49.5% 0.5%
-2.576 +2.576
• 例2:某年某地150名12岁健康男童体重的均数为36.3 kg, 标准差为6.19 kg,试估计:
4455667777 7888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
• 标准正态分布用N(0,1)表示。
0.1
0.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0
• 实际应用中,经u变换可把求解任意一个正态曲线 下面积的问题,转化成标准正态分布曲线下相应 的面积问题。
• 为应用方便,制成统计用表(附表1):标准正态 分布曲线下的面积,Φ(-u)值。
百分位数法
年龄 人数 累计 累计频
(岁)
人数 率(%)
10~
7
7
0.7
11~ 44 51
5.1
12~ 153 204
20.5
13~ 244 448
45.0
14~ 269 717
72.0
15~ 191 908
91.2
16~ 61 969
97.3
17~ 16 985
98.9
18~
8 993
99.7
19~
正态分布法
• 对服从正态分布的指标,可根据正态曲线 下面积的分布规律进行参考值范围的估计。
• 首先进行正态性检验 • 若服从正态分布,计算均数x与标准差S • 估计参考值范围
– xuα/2S(双侧) – x+uαS或x-uαS (单侧)
• 例3. 某年某地测得100名正常成人的血铅含 量(ug/dl)如下,试确定该地正常成人血铅含 量的95%参考值范围。
• P97.5=17+1/16(996 97.5%969)=17.13(岁)
• 该地女学生月经初潮年龄 95%参考值范围为 11.41~17.13。
正态分布的应用
• 质量控制:
– 为了控制实验中的检测误差,常以x2S作为上、下警 戒值,以x3S作为上、下控制值。
• 正态分布是很多统计方法的理论基础 • 2分布、t分布、F分布等,都是在正态分布的基
举例
P X 8 .3821
正态分布
10
Z X 8 5 .30 10
标准正态分布
Z 1 .3821
8X
5
0.30
Z 0
Z
• 当μ和σ未知时,要用样本均数x和样本标准差S来 估计u值。
• u=(x-x)/S
• 例1: 若x~(μ,σ2),试计算x取值在区间 μ1.96σ上的概率。
• 正态分布的特征是:1)曲线在横轴上方,均数处最高;2)以均数为中心,左右 对称;3)确定正态分布的两个参数是均数μ和标准差σ。正态分布用N(μ,σ2)表 示,为了应用方便,常对变量X作u=(X-μ)/σ变换,使μ=0,σ=1,则正态分布转换 为标准正态分布,用N(0,1)表示。
• 正态曲线下面积的分布有一定规律。理论上μ1 σ,μ1.96σ和μ2.58σ区间的面积 (观察单位数)各占总面积(总观察单位)的68.27%,95%和99%,可用于估计 医学参考值范围和质量控制等方面。
1 994
99.8
20~ 2
996 100.0
合计 996 — —
不满足正态分布时,可用百分 位数法估计参考值范围
• 例5. 某年某地996名女学生月 经初潮年龄分布,确定95% 参考值范围。
• 呈正偏态分布。计算双侧 95%界值P2.5和P97.5
• P2.5=11+1/44(996 2.5%7)=11.41(岁)
(2)分别计算x1=30和x2=40所对应的u值,得到u1=-1.02和u2=0.60,查 附表1得: Φ(-1.02)=0.1539和Φ(-0.60)=0.2743,因此Φ(0.60) - Φ(-1.02)=(1- Φ(-0.60))- Φ(-1.02)=(1-0.2743)0.1539=0.5718,即理论上体重在30kg~40kg者占该地12岁健康男童 总数的57.18%。
u1=(x1- μ)/σ=[(μ-1.96 σ)- μ]/ σ=-1.96 u2=(x2- μ)/σ=[(μ+1.96 σ)- μ]/ σ=1.96 P(-1.96<u<1.96)= Φ(1.96)- Φ(-1.96)
=1-2 Φ(-1.96)=1-2x0.025=0.95
即x 取值在区间μ1.96σ上的概率为95%。
1.5 正态分布及其应用
• 重点掌握: • 正态分布的概念与特征 • 标准正态分布的概念和标准化变换 • 正态分布的应用
– 估计频数分布 – 确定医学参考值范围
正态分布的概念和特征
频数分布示意图 f(X)
概率密度曲线示意图
一、正态分布(Normal 的概念 Distribution)
• 频数分布图,当观察人数足够多,组 段不断分细,图中直条将逐渐变窄, 其顶端将逐渐接近于一条光滑的曲线。 这条曲线称为频数曲线或频率曲线, 略呈钟型,两头低,中间高、左右对 称,近似数学上的正态分布。由于频 率的总和等于100%或1,故横轴上曲 线下的面积等于100%或1。
础上推导出来的。某些分布,如t分布、二项分布、 Poisson分布等的极限均为正态分布,在一定条件 下,均可按正态近似的原理来处理。常用的u检验, 就是以正态分布为理论基础。
小结
• 正态分布是一种很重要的连续性分布,不少医学现象服从正态分布或近似正态分 布,或经变量变换转换为正态分布,可按正态分布规律来处理,它也是许多统计 方法的理论基础。
– σ是变异度参数:当μ恒定
时,σ越大,表示数据越分
散,曲线越“胖”;σ越小,
表示数据越集中,曲线越
“瘦”。
μ
– N(μ,σ2)表示均数为μ,
方差为σ2的正态分布。
• 正态曲线下面积的分布有一定 规律。
标准正态分布
• 为了应用方便,常作如下变换
• 将图A的原点移到µ的位置,横轴尺度以σ为单位,使µ=0,σ=1,则将正态分布变为标准正态分布
(1)该地12岁健康男童体重在50kg以上者占该地12岁健康男童总数 的百分比;
(2)体重在30~40kg者占该地12岁健康男童总数的比例; (3)该地80%的12岁健康男童体重的分布范围。
• 解答:
(1)将x=50代入公式,u=(50-36.3)/6.19=2.21 根据正态分布的对称性可知,u=2.21右侧的尾部面积与u=-2.21左侧 的尾部面积相等,查表Φ(-2.21)=0.0136,即理论上该地12岁健康 男童体重在50kg以上者占该地12岁健康男童总数的1.36%。
• 医学参考值范围的估计方法:
(standard normal distribution)
• u或z称为标准正态变量或标准正态离差(standard normal deviate)。
• 标准正态分布的密度函数
Area = 1.00
-∞<x<+∞
相关主题