第三章 正态分布
u
u指单侧U界值,也称
随机变量U的上侧α 分 位数。其意义为:从u 到+∞这一侧的面积为 α。
u/2
u/2 指双侧U界值,也
称随机变量U的双侧α 分位数。其意义为:从 u/2 到+∞这一侧的面 积为α /2,从-∞到-u/2 这一侧的面积也为α /2, 两侧面积之和为α 。
1.3 正态分布曲线及其面积分布
图3-8 两尾概率
图 正态分布两尾概率
对于标准正态分布,其两尾概率为: P(∣u∣≥1.96)=0.05 P(∣u∣≥2.58)=0.01
图 标准正态分布两尾概率
图 标准正态分布两尾概率
标准正态分布,其单尾概率为
图 标准正态分布单尾概率
图 标准正态分布单尾概率
图 正态分布与标准分布的概率
例如 x在(μ -1.96σ ,μ +1.96σ )之外取值的两尾概率 为0.05,而一尾概率为0.025。即: P(x<μ -1.96σ )=P(x>μ +1.96σ )=0.025
图
正态分布两尾概率
同理,x在(μ-2.58σ,μ+2.58σ)之外取值的两尾概率为0.01, 而一尾概率为0.01。即: P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.01。
第三章 正态分布
正态分布的概念 • 正态分布的通俗概念: 如果把数值变量资料编 制频数表后绘制频数分布图(又称直方图,它用 矩形面积表示数值变量资料的频数分布,每条直 条的宽表示组距,直条的面积表示频数(或频率 )大小,直条与直条之间不留空隙。),若频数 分布呈现中间为最多,左右两侧基本对称,越靠 近中间频数越多,离中间越远,频数越少,形成 一个中间频数多,两侧频数逐渐减少且基本对称 的分布,那我们一般认为该数值变量服从或近似 服从数学上的正态分布。
N(μ1 ,σ2)、N(μ2 ,σ2)
max
f(x)
0
µ1 µ2
在μ不变的情况下,函数曲线位置不变,若σ变大 时,曲线形状变的越来越“胖”和“矮”;若σ变 小时,曲线形状变的越来越“瘦”和“高”,故 称σ为形态参数或变异度参数。
N(μ,0.52)、N(μ,12)、N(μ,22)
σ =0.5
f(x)
σ =1 σ =2
0
µ
(4)正态分布概率密度曲线与横轴围成
的区域的总面积等于1。
1.2 标准正态分布
参数μ=0,σ2 =1时的正态分布称为 标准正态分布。一般地,若随机变量 X~N(μ,σ2),则都可以通过标准化 转换:u=(x-μ)/σ,将X 转化为标准 正态变量U(U的取值为u ),记为 U ~N(0,1)。
标准正态分布的概率密度函数为
(u )
1
1 2
e
u2 2
(-≦<u<+≦)
标准正态分布的概率分布函数为:
(u )
2
u
e
u2 2
du
(-∞<u<+∞)
图 正态分布与标准正态分布的面积与纵高
标准正态分布曲线 的纵坐标与面积关 系图
即纵坐标从-∞移到u所对应区域的面积为上图红色区域 面积的大小,这样一个区域的面积我们用Ф(u)表示,可通 过查标准正态分布曲线面积分布表得到Ф(u)的大小。 u值查表所对应的面积是区间(-∞,u)所对应的面积,即 Ф(u)。 若u=-1.96,那么Ф(-1.96)则表示从-∞移到-1.96所对应 区域的面积,通过查标准正态分布曲线面积分布表得到 Ф(-1.96)=0.025。
正态分布密度曲线和横轴围成的整个区域面积为1,随机 变量x在(-∞,+∞)之间取值,是一个必然事件,其 概率为1。若随机变量x服从正态分布N(μ ,σ 2),则x的 取值落在任意区间[x1,x2)的概率,记作:P(x1≤x<
x2),等于下图中阴影部分的面积。
图 正态分布的概率
• 在正态曲线下,μ±1σ、μ±1.96σ和 μ±2.58σ所对应的面积分别为0.6827、 0.9500和0.9900。
以某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态 分布。 • 频数分布表:
某地 13 岁女孩 118 人的身高(cm)资料频数分布 身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~ 159~162 合计 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
160.5
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数分布图二
20
频数
10
0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数分布图三
14 12
10
8
频数
6
4
2 0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
1 正态分布
1.1 正态分布的定义及其特征 正态分布的定义:若连续型随机变量X的概 率密度函数为
关于正态分布,有几个概率应记住:
一般正态分布:
P(μ-σ≤x<μ+σ)=0.6826
P(μ-1.96σ≤x<μ+1.96σ)=0.95 P(μ-2.58σ≤x<μ+2.58σ)=0.99
标准正态分布:
P(-1≤u<1)=0.6826
P(-1.96≤u<1.96)=0.95 P(-2.58≤u<2.58)=0.99
1
2
x
e
(t ) 2
2
2
dt
正态分布的特征
(1)正态分布曲线 位于横轴上方,呈钟 形。
f(x)
max
(2)正态分布曲线 以均数所在处最高, 且以均数为中心左右
0
µ
对称。
(3)正态分布曲线由两个参数决定,即总体均数μ 和总体标准差σ。 在σ不变的情况下,函数曲线形状不变,若μ变大 时,曲线位置向右移;若μ变小时,曲线位置向左 移。故称μ为位置参数。
f x
1 2
e
1 2
2 x 2
x
则该随机变量服从正态分布。 其中,σ>0,μ、σ均为常数,则称随机 变量X服从参数为μ和σ2的正态分布,记作 X ~N (μ,σ2 )。
图
正态分布密度函数曲线
其正态分布的概率分布函数为:
F ( x)
频数分布图一(又称直方图 )
30
20
从频数表及频数分布图上可得 知: 该数值变量资料频数分 布呈现中间频数多,左右两侧 基本对称的分布。所以我们通 俗地认为该资料服从正态分布 。
频数
10 0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5
154.5
157.5