正态分布概念
图2-4 频数分布与正态分布曲线示意图
一、正态分布的概念和特征
1.正态分布曲线的数学函数表达式:
X服从的概率密度函数f(x)
f (X)
1
1( X )2
e2
2
(-<X< )
X为连续随机变量,μ为X值的总体均数, σ2 为总体方差,记为X~N( μ , σ2)
1.正态分布
正态分布的分布密度函数为:f(x)=σ
解析:从正态曲线的图像可知,该正态曲线关于直线 x=20
对称,最大值为 2
1 ,所以 π
μ=20,
1= 2π·σ 2
1 ,解得 π
σ=
2.于是概率密度函数的解析式为 f(x)=2 1πe-x-4202,x∈(-∞,+∞).
总体随机变量的期望是 μ=20,方差是 σ2=( 2)2=2.
正态分布 (Normal distribution)
正态分布
概述
正态分布是描述连续型变量值分布 的曲线,医学上许多资料近似服从正态 分布。
正态分布在统计推断上有重要的作用。 直方图的频数分布与正态分布
(见图2-4)
频数(f)
25 20 15 10
5 0
2.30~ 2.90~ 3.50~ 4.10~ 4.70~ 5.30~
(5)最值性:当 x=μ时, f, ( x)取得最大值
1
2
σ越大,曲线越“矮胖”,表示总体的分布越
分散;反之σ越小,曲线越“瘦高”,表示总体
的分布越集中.
(6) 几 何 性 : 参 数 μ 和 σ
y
的统计意义:E(x)=μ,曲
线的位置由μ决定
;D(x)=σ2, 曲 线 的 形 状
由σ决定.
o
x
正态分布曲线下面积的含义
101名正常成年女子血清胆固醇分布
0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 12.0 14.5 17.0 19.5 22.0 24.5 27.0 29..1 0.08 0.06 0.04 0.02
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
(1)试求考试成绩X位于区间(70,110)内的概率是多少? (2)若这次考试共有2 000名考生,试估计考试成绩在 (80,100)之间的考生大约有多少人? [思路点拨]
正态 分布
―→
确定μ,σ 的值
―→
正态分布在三个特 殊区间上的概率
―→
求 解
[精解详析] ∵X~N(90,100),
∴μ=90,σ= 100=
1 2πe
-x-2σμ2 2
,x
∈(-∞,+∞),其中 μ 表示 均值,σ2(σ>0)表示 方差 .通
常用 X~N(μ,σ2)表示 X 服从参数为 μ 和 σ2 的正态分布.
2.正态分布密度函数满足以下性质 (1)函数图像关于直线 x=μ 对称. (2)σ(σ>0)的大小决定函数图像的 “胖”“瘦” .
(8 分)
4.某年级的一次信息技术测验成绩近似服从正态分布 N(70,102),如果规定低于60分为不及格,求: (1)成绩不及格的学生占多少? (2)成绩在80~90之间的学生占多少?
解 : (1) 设 学 生 的 得 分 为 随 机 变 量 X , X ~ N(70,102),如图所示,则 μ=70,σ=10,P(70- 10<X<70+10)=0.683, ∴不及格的学生的比为 12×(1-0.683)=0.158 5, 即成绩不及格的学生占 15.85%.
3. 3个特殊结论 若 X : N (, 2 ) ,则
区间
,
2 , 2
3 , 3
取值概率
0.6826 0.9544 0.9974
通常服从于正态分布N(μ,σ2)的随机变量X在区间(μ-3σ,
μ+3σ)外取值的概率只有
. 0.3%
1.正态分布完全由参数μ和σ确定,因此可把正态 分布记作N(μ,σ2).
1.已知随机变量 X 服从正态分布 N(4,σ2),则 P(X
>4)=
()
A.15
B.14
1
1
C.3
D.2
解析:由正态分布密度函数的性质可知,μ=4 是该
函数图像的对称轴,∴P(X<4)=P(X>4)=12.
答案:D
[例2] (8分)在某次数学考试中,考生的成绩X服从一 个正态分布,即X~N(90,100).
2.要正确理解μ,σ的含义.若X~N(μ,σ2),则 EX=μ,DX=σ2,即μ为随机变量X取值的均值,σ2为 其方差.
2.正态曲线的性质
(1)非负性:曲线 f, (x) 在轴的上方,与x轴
不相交(即x轴是曲线的渐近线).
(2)定值性:曲线f, (x) 与x轴围成的面积为1.
(3)对称性:正态曲线关于直线 x=μ对称, 曲线成“钟形”. (4)单调性:在直线 x=μ的左边, 曲线是上升的; 在直线 x=μ的右边, 曲线是下降的.
(2)因为 P(X≥5)=P(X≤-3), 所以 P(X≥5)=12[1-P(-3<X≤5)] =12[1-P(1-4<X≤1+4)] =12[1-P(μ-2σ<X≤μ+2σ)] =12(1-0.954) =0.023.
[一点通] 对于正态分布N(μ,σ2),由x=μ是正态曲 线的对称轴知,
(1)对任意的a,有P(X<μ-a)=P(X>μ+a); (2)P(X<x0)=1-P(X≥x0); (3)P(a<X<b)=P(X<b)-P(X≤a).
1.表示变量值(x)在【a-b】区间变量值 所占全部(总体)变量值的比例或概率 (p)。
2变量值在整个曲线下的面积为100%,或 出现的概率为1。
[例1] 设X~N(1,22),试求: (1)P(-1<X≤3);(2)P(X≥5). [思路点拨] 首先确定μ=1,σ=2,然后根据三个特 殊区间上的概率值求解. [精解详析] 因为X~N(1,22), 所以μ=1,σ=2. (1)P(-1<X≤3)=P(1-2<X≤1+2)=P(μ-σ<X≤μ+σ) =0.683.
(2)成绩在 80~90 之间的学生的比为 12[P(50< X< 90)-P(60< X< 80)] =12×(0.954-0.683)=0.135 5, 即成绩在 80~90 之间的学生占 13.55%.
2.如图所示,是一个正态分布密度曲 线.试根据图像写出其正态分布的 概率密度函数的解析式,并求出总 体随机变量的期望和方差.
(2 分)
(1)P(70<X<110)=P(90-2×10<X<90+2×10)=0.954,
即成绩 X 位于区间(70,110)内的概率为
(5 分)
(2)P(80<X<100)=P(90-10<X<90+10)=0.683,
∴2 000×0.683=1 366(人).
即考试成绩在(80,100)之间的考生大约有 1 366 人.