当前位置:文档之家› 定性数据的统计描述、正态分布以及应用(normaldistribution)

定性数据的统计描述、正态分布以及应用(normaldistribution)


-2.58 -1.96 -1
0
1 1.96 2.58
标准正态分布
-1~1 -1.96~1.96 -2.58~2.58
面积或概率 68.27% 95.00% 99.00%
曲线下面积分布规律
68.27%
68.27%
95.00%
95.00%
-2.58 -1.96 -1
99.00%
0
1 1.96 2.58μ-2.58σ μ-1.96σ μ-σ
标准正态分布
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,1)
一般正态分布为一个分布族:N(m,2) ;标准
正态分布只有一个 N(0,1) ;这样简化了应 用
u曲线下面积
0.5
f(X)
1 u X2
0.4
-∞
u0.3
(u)
五. 正态分布的应用
1.许多医学指标服从正态分布或近似 正态分布,如同性别、同年龄儿童的身 高,同性别健康成人的红细胞数、血红 蛋白量等,及实验中的误差。
2. 估计医学参考值范围 医学正常值范围
定义:又称参考值范围,是指特定健康人群的 解剖、生理、生化等各种数据的波动范围。习 惯上是确定包括95%的人的界值。
e 2dX
2
0.2
附表(标准正态分布
0.1
左侧曲线下面积)就
0.0
是根据此公式和图形
-4 -3 -2 -1 0 1 X
2
3
4
制定的
曲线下面积分布规律
查附表
68.27%
( 1 .9 6 ) P (u 1 .9 6 ) ?
95.00%
99.00%
(1 .9 6 ) P (u 1 .9 6 ) ?
经过标准化转换,就可以利用标准正太
分布求出原始变量X有关的概率值
例如成年男子红细胞数近似服从正太分布,
x~N(4.7,80.382)
,现
想知道在4x1012/L以下所占的比例。
u44.782.05 0.38
查附表1得:
(2.05)0.0202
表明成年男子的红细胞数低于4x1012/L的人约占总 体的2%.
定性数据的统计描述、正态分布以及应用 (normal distribution)
一.概念
正态分布又称高斯(Gaussian distribution) ,是统计学中一种最常见、最重要的连续型变量的 对称分布,医学资料中有许多指标如身高、体重、 红细胞数、血红蛋白、收缩压等频数分布都呈正态 分布。
频数分布逐渐接近正态分布示意图 (若纵轴改为频率)
0.5
0.4
0.3
N (0,12 )
N(1,1.22)
位置参数μ决定曲线的位置,0形.2 态参数σ决定曲线的形态
0.1
0
-4
-3
-2
-1
0
1
2
3
X
4.正态曲线下面积的分布规律
• 横轴上曲线下的面积为1 • 曲线下,横轴上对称于μ的左右两边面积相等
正态分布 μ±σ μ±1.96σ μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
正态分布的特殊形式:标准正态分布N (0 ,1);
即μ=0,σ=1时(z分布、u分布)
标准正态变换(变换公式);u=
xm
特征
1. 是单峰曲线,x=μ
2. 以均数μ为中心左右对称
3. 有2个参数,μ:位置参数,变异度参数 Nhomakorabeaσ:
σ越大,数据越分散,曲线越平 坦。
N(1,0.82)
0.6
f (X )
99.00%
μ
μ+σ μ+1.96σ
μ+2.58σ
标准正态分布 正态分布
-1~1
μ±σ
-1.96~1.96 μ±1.96σ
-2.58~2.58 μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
以上讨论的是标准正态分布,对一般的正
态分布,某指标X~N(μ,σ2),则
u=(x-μ)/σ~N(0,1) 即-1.96<u<1.96的面积为0.95 μ-1.96σ<x<μ+1.96σ的面积为0.95
t
自 由 度 为 1的 t分 布 自 由 度 为 9的 t分 布 标准正态分布
2.百分位数法
应用条件 : 任何分布,特别是偏态分布资料
计算公式: 双侧界值:P2.5 ~ P97.5 单侧 上界:P95 单侧 下界:P5
630名正常女性血清甘油三酯含量的资料
注意
95%参考范围(reference range)或正常 范围(normal range)仅仅告知健康者中95% 的人测定值在此范围之内,并非告知凡在此范 围之内皆健康,也非告知凡在此范围之外皆不 健康,所以不可将之作为诊断标准。
正态曲线( normal curve ) 图形特点:
1. 钟型
f(X)
2. 中间高
3. 两头低 4. 左右对称
5. 最高处对应 于X轴的值
就是均数
6. 标准差决定 X 曲线的形状
m
7. 曲线下面积
为1
8. 拐点 m
数学式
正态分布密度函数
e f(X) 1
2
(xm)2 2 2
( X )
其中是μ均数,σ是标准差。记N (μ,σ2)
3. 正态分布是许多统计方法的理 论基础,如后面要讲的t检验、方差分析、 相关回归等,t分布、二项分布、Poisson 分布的极限分布也是正态分布。
t分布
随机变量X N(m,2)
均数 X
u变换
标准正态分布
N(0,12)
标准正态分布
N(0,12) Student t分布 自由度:n-1
t分布的概率密度函数
式中
为伽玛函数; 圆周率(Excel函
数为PI( ))
为自由度(degree of freedom),是t 分布的唯一参数;t为随机变量。
以t为横轴,f(t)为纵轴,可绘制t分布曲线。
t分布曲线
0.4 f( t) 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0 -4 -3 -2 -1 0 1
单双侧: 根据指标的实际用途,有的 指标有上下界值,过高过低均属异常; 某些指标过高为异常,只需确定上限; 某些指标过低为异常,只需确定下限。
估计的方法: 1、正态分布法(正态分布) 2、百分位数法(任何分布)
1.正态分布法 xu s
应用条件:正态分布或近似正态分布资料
结果稳定,所需样本量不大
计算
95% 正常值(医学参考值)范围公式:
双侧:(x 1.9s, 6x1.9s)6即 x1.96s
单下: x1.64s5 单上: x1.64s5
例 120名健康成年男性农民舒张压的均数为 10.1kPa,标准差为0.93kPa,求舒张压的双侧 95%正常值范围。 10.1±1.96×0.93 即8.28~11.92 kPa
相关主题