当前位置:文档之家› 2019精品概率论及数理统计概率分布数学

2019精品概率论及数理统计概率分布数学


66.0~75.0 (g/L)之间的比例为68.23%。估计110
名正常 成年女 子中血 清总蛋 白介于 66.0~75.0
(g/L)之间的人数约为 110 68.23% 75 人。
2019/4/27
28
4.正态分布的应用
4.1 制定医学参考值范围
参考值范围(reference range)是指所谓“正 常人”的解剖、生理、生化等指标的波动范围。 制定参考值范围时,首先要确定一批样本含量足 够大的“正常人”。所谓“正常人”不是指“健 康人”,而是指排除了影响所研究指标的疾病和 有关因素的同质人群。其次需根据指标的实际用 途确定单侧或双侧界值,根据研究目的和使用要 求选定适当的百分界值,常用95%。
2019/4/27 15
图4 正态分布位置变换示意图
2019/4/27 16
0.9 0.8 0.7 0.6
f(X)
0.5 0.4 0.3 0.2 0.1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
X
图5 正态分布形态变换示意图
2019/4/27 17
5. 正态分布曲线下的面积分布有一定规律:正态曲 线与横轴所夹的面积为1。 位于 ( μ 1.64σ,μ 1.64σ ) 内的面积为0.90;
式中, 为总体均数, 为总体标准差, 为圆周 率,e为自然对数的底,仅x为变量。 当x确定后, f(x)为X相应的纵坐标高度,则X服 从参数为μ和σ2的正态分布(normal distribution),记 作X~N( , 2)。
2019/4/27 9
一般地,若连续型随机变量,设其概率密度函 数为 f ( x),则X取值落在区间( ,x) 内的累积 在 x上的积分,记 f ( x) 到
对应于从 -∞ 到 x 概率密度曲线下的阴影的面
积(常称为左侧尾部面积),见图3。
图3 正态分布的概率密度函数
2019/4/27 12
于是,利用概率密度函数 F ( x) 可以计算正态
分布变量取值在任意区间(a,b)的概率为
P(a≤X<b)=
F (b) F (a)
2019/4/27
13
2019/4/27
2019/4/27
连续型变量 离散型变量
2
【教学目的】
了解
正态分布的密度函数 二项分布的应用 Poisson分布的应用
掌握
正态分布曲线的特征 及应用
二项分布的概念与特 征 Poisson分布的概念与 特征
2019/4/27
3
一、正态分布
1. 概念
频率密度图的绘制
例:随机调查某医院 1402例待分娩孕妇,测得她们的体重。 体重在各组段的频数分布见表 1第 2 列,并求得体重落在
14
2.正态分布的特征
1. 2. 对称性:正态分布为单峰、对称分布,以均数为中心, 左右对称。 正态分布的图形由均数和标准差两个参数决定。 位置参 数,即集中趋势的位置;变异度参数 ,表示正态变量 取值的离中程度。 概率密度函数f(x)在x取均值时达到最大,峰值为
1 2
3.
4. 随机变量X的取值从-∞到+∞,相应的概率密度函数对应 的曲线位于x轴上方,并与X轴永不相交;
变量或标准正态离差。
2019/4/27 20
正态分布
1 ( X ) 2 / 2 2 f (X ) e , X 2
u
标准正态分布
X

; 0, 1
( u)
2019/4/27
1 u2 / 2 e , u 2
参考值范围。
2019/4/27
39
解:由于该地健康成年男子第一秒肺通气量近似服 从正态分布,可用正态分布法计算。因第一秒肺 通气量仅过低属异常,故只需求出下限。
80842019/4/27
17
3 1402
0.0121
0.0021 1.0000
0.9979
1.0000
0.0030
0.0005
5
合计
0.08 0.06 0.04 0.02 0.00 4856647280体重(kg)
体重频率密度
图1 体重频率密度图
若将各直条顶端的中点顺次连接起来 , 得 到一条折线。当样本量 n越来越大时,组段越 分越细,此时直方渐进直条,这条折线就越来 越接近于一条光滑的曲线(见图1、2),我们 把这条呈中间高,两边低,左右基本对称的 “钟型”曲线称为正态分布曲线,近似于数学 上的正态分布(高斯分布; Gauss)。
正态分布法 百分位数法 单侧 下限 上限 双侧 下限 P5~P95 P2.5~P97.5 P0.5~P99.5 P10 P5 P1 单侧 上限 P90 P95 P99
双侧
90 95 99
X 1.64S X 1.96S
X-1.28S
X 1.28S X 1.64S
X-1.64S
X 2.58S
试估计该地健康女性血红蛋白的95%参考值 范围。
2019/4/27
34
因血红蛋白过高、过低均为异常,所以按双 侧估计95%医学参考值范围:
上限为:
x 1.96 s 117.4 1.96 10.2 137.39( g / l )
下限为:
x 1.96 s 117.4 1.96 10.2 97.41( g / l )
2019/4/27
25
解:本例由于是大样本,可用样本均数和样本 标准差作为总体、的估计值,即将该地正常 成年女子的血清总蛋白数近似看作服从 N(72.8,3.82)的正态分布。作如下标准化变换:
66.0 72.8 Z1 1.79 3.8
2019/4/27
Z2
75.0 72.8 0.58 3.8
X-2.33S
X 2.33S
双侧ua 单侧ua 如双侧u0.10 单侧u0.05 1.64
2 ,
2019/4/27
37
计算某地正常女子血清总蛋白的95%参考值范围。
X 72.8 g / L, S 3.8 g / L
由于该地正常成年女子血清总蛋白近似服从正态分 布,可用正态分步法计算,因血清总蛋白过多过 少均属异常,故计算95%参考值范围的上下限为:
第二章
概率分布
2019/4/27
1


由于存在个体差异,即使从同一总体中抽取的 两份样本之间也会有所不同,因此需要对总体 特征做出描述。 随机变量的分布常见的有三种类型:
正态分布(normal distribution)
二项分布(binominal distribution) Poisson 分布( Poisson distribution)
各组段的频率(表 1 的第 3 列)。 现以体重测量值为横
轴,以频率与组距的比值为纵轴作出直方图。由于 该直方图的纵轴表示在每个组段内单位长所占有的 频率,相当于频率密度,因此我们将此图称为频率 密度图(见图1)。
2019/4/27 4
表1 某医院1402例分娩孕妇体重频数分布
体重组段 频数 486 频率 频率密度 累积频率 (频数/总频数) (频率/组距) 0.0043 0.0043 0.0011
位于 ( μ 1.96σ,μ 1.96σ ) 内的面积为0.95;
位于 ( 2.58 , 2.58 ) 内的面积为0.99。
2019/4/27
18
图6 正态分布曲线下面积分布规律示意图
2019/4/27
19
3. 标准正态分布
为 了 实 际 应 用 的 方 便 , 设 U=(x-)/ 或 Z=(x-)/ ,即将原点移到 的位置,横轴尺 度以 为单位,使=0,=1,则将原正态分 布变换为标准正态分布N(0,1)。U为标准正态
下限为: X 1.96S 72.8 1.96 3.8 65.35( g / L) 上限为: X 1.96S 72.8 1.96 3.8 80.25( g / L)
2019/4/27 38
例:某地调查120名健康成年男性的第一秒肺通气
量得均数 X =4.2(L), 标准差S =0.7(L),试据此 估计该地健康成年男子第一秒肺通气量的 95%
2019/4/27
24
例 : 已知某地正常成年女子的血清总蛋白数服从正 态分布,调查了该地 110 名正常成年女子,得样 本血清总蛋白均数为72.8(g/L),标准差为3.8(g/L), 试估计该地正常成年女子血清总蛋白介于 66.0~75.0(g/L) 之间的比例,以及 110 名正常成年 女子中血清总蛋白介于66.0~75.0(g/L)之间的人数。
概率为概率密度曲线下位于 的图形面积, ( ,x) 等于其概率密度函数 作 。 F ( x)
2019/4/27
10
1 F ( x) P( X x) 2π

x

e

( t )2 2 2
dt
称 F ( x )为正态分布 N ( , 2 ) 的概率密度函 数。其值表示变量落在区间 ( ,x)的概率,
2019/4/27 29
制定观察指标参考值范围的一般步骤:
依据观察指标的特点、背景和已知的影响因素, 确定抽样的入选标准和排除标准;
根据指标特点决定单侧或双侧;
确定范围:一般为95%;
按资料特点选取不同方法计算正常值范围的上下 限。
2019/4/27
30
双侧临界值:标准正 态分布双侧尾部面积 之和等于α时所对应 的正侧变量值称为双 侧临界值,记作 Za/2 或 Ua/2。
2019/4/27 7
0.08 0.06 0.04 0.02 0.00 4856647280体重(kg)
相关主题