正态分布概念
正态分布 (Normal distribution)
正态分布பைடு நூலகம்
概述
正态分布是描述连续型变量值分布 的曲线,医学上许多资料近似服从正态 分布。
正态分布在统计推断上有重要的作用。 直方图的频数分布与正态分布
(见图2-4)
25
20
(f) 15
数 频
10
5
0 2.30~
2.90~
3.50~
4.10~
4.70~
函数图像的对称轴,∴ P(X<4)=P(X>4)=12.
答案:D
[例2] (8分)在某次数学考试中,考生的成绩X服从一 个正态分布,即X~N(90,100).
(1)试求考试成绩X位于区间(70,110)内的概率是多少? (2)若这次考试共有2 000名考生,试估计考试成绩在 (80,100)之间的考生大约有多少人? [思路点拨]
f(x)=σ
1 2π e
-?x- 2σμ2 ?2
,x
∈(-∞,+∞),其中 μ 表示 均值,σ2(σ>0)表示 方差 .通
常用 X~N(μ,σ2)表示 X 服从参数为 μ 和 σ2 的正态分布.
2.正态分布密度函数满足以下性质
(1)函数图像关于直线 x=μ 对称. (2)σ(σ>0)的大小决定函数图像的 “胖”“瘦” .
(2)定值性:曲线f?,? (x) 与x轴围成的面积为1.
(3)对称性:正态曲线关于直线 x=μ对称, 曲线成“钟形”. (4)单调性:在直线 x=μ的左边, 曲线是上升的 ; 在直线 x=μ的右边, 曲线是下降的 .
(5)最值性:当 x=μ时, f? ,? (x)取得最大值 ?
1
2?
σ越大,曲线越“矮胖”,表示总体的分布越
(5 分)
(2)P (80< X<100) =P (90- 10<X<90 +10)=0.683 ,
∴2 000×0.683=1 366(人).
即考试成绩在 (80,100)之间的考生大约有 1 366 人.
(8 分)
4.某年级的一次信息技术测验成绩近似服从正态分布 N(70,102),如果规定低于60分为不及格,求: (1)成绩不及格的学生占多少? (2)成绩在80~90之间的学生占多少?
分散;反之σ越小,曲线越“瘦高”,表示总体
的分布越集中.
(6) 几何性 : 参数 μ 和 σ
y
的统计意义:E( x)=μ,曲
线的位置由μ决定
;D(x)=σ2, 曲 线 的 形 状
由σ决定.
o
x
正态分布曲线下面积的含义
1.表示变量值(x)在【a-b】区间变量值 所占全部(总体)变量值的比例或概率 (p)。
5.30~
101 名正常成年女子血清胆固醇分布
0.14 0.12 0.1 0.08 0.06 0.04 0.02
0 12.0 14.5 17.0 19.5 22.0 24.5 27.0 29.5 32.0
f(X)
0.14 0.12
0.1 0.08 0.06 0.04 0.02
0 12.00 14.50 17.00 19.50 22.00 24.50 27.00 29.50 32.00
图2-4 频数分布与正态分布曲线示意图
一、正态分布的概念和特征
1.正态分布曲线的数学函数表达式:
X服从的概率密度函数f(x)
f (X) ?
1
e?
1( 2
X?
?
?
)2
? 2?
(-? <X< ? )
X为连续随机变量,μ为X值的总体均数, σ2 为总体方差,记为X~N( μ , σ2)
1.正态分布
正态分布的分布密度函数为:
(1)对任意的a,有P(X<μ-a)=P(X>μ+a); (2)P(X<x0)=1-P(X≥x0); (3)P(a<X<b)=P(X<b)-P(X≤a).
1.已知随机变量 X 服从正态分布 N(4,σ2),则 P(X
>4)=
()
A.15
B.14
1
1
C. 3
D.2
解析:由正态分布密度函数的性质可知, μ=4 是该
. 0.3%
1.正态分布完全由参数μ和σ确定,因此可把正态 分布记作N(μ,σ2).
2.要正确理解μ,σ的含义.若X~N(μ,σ2),则 EX=μ,DX=σ2,即μ为随机变量X取值的均值,σ2为 其方差.
2.正态曲线的性质
(1)非负性:曲线 f? ,? ( x) 在轴的上方,与x轴
不相交(即x轴是曲线的渐近线).
3. 3个特殊结论 若 X : N(? ,? 2 ) ,则
区间
?? ? ? , ? ? ? ?
?? ? 2? , ? ? 2? ?
?? ? 3? , ? ? 3? ?
取值概率
0.6826 0.9544 0.9974
通常服从于正态分布N(μ,σ2)的随机变量X在区间(μ-3σ,
μ+3σ)外取值的概率只有
解 : (1) 设 学 生 的 得 分 为 随 机 变 量 X , X ~ N(70,102),如图所示,则 μ=70,σ=10,P(70- 10<X<70+10)=0.683, ∴不及格的学生的比为 12×(1-0.683)=0.158 5, 即成绩不及格的学生占 15.85%.
(2)成绩在 80~90 之间的学生的比为 12[P(50< X < 90)-P(60< X < 80)] =12×(0.954-0.683)=0.135 5, 即成绩在 80~90 之间的学生占 13.55%.
正态 确定μ,σ 正态分布在三个特
求
分布 ―→ 的值
―→ 殊区间上的概率 ―→ 解
[精解详析 ] ∵X~N(90,100),
∴μ=90,σ= 100=
(2 分)
(1)P (70< X<110) =P (90 - 2×10<X<90 +2×10) =0.954 ,
即成绩 X 位于区间 (70,110)内的概率为
2变量值在整个曲线下的面积为100%,或 出现的概率为1。
[例1] 设X~N(1,22),试求: (1)P(-1<X≤3);(2)P(X≥5). [思路点拨] 首先确定μ=1,σ=2,然后根据三个特 殊区间上的概率值求解. [精解详析] 因为X~N(1,22), 所以μ=1,σ=2. (1)P(-1<X≤3)=P(1-2<X≤1+2)=P(μ-σ<X≤μ+σ) =0.683.
(2)因为 P(X≥5)=P(X≤- 3), 所以 P(X≥5)=12[1-P(-3<X ≤5)] =12[1-P (1-4<X ≤1+4)] =12[1-P (μ-2σ<X ≤μ+2σ)] =12(1-0.954) =0.023.
[一点通] 对于正态分布N(μ,σ2),由x=μ是正态曲 线的对称轴知,