第二节随机变量及其分布第二节随机变量及其分布一、随机变量表示随机现象结果的变量称为随机变量。
常用大写字母等表示,它们的取值用相应的小写字母x, y, z 等表示。
假如一个随机变量仅取数轴上有限个点或可列的个数点 (见图1.2-1) ,则称此随机变量为离散随机变量,或离散型随机变量。
假如一个随机变量的所有可能取值充满数轴上一个区间 (a,b)( 见图1.2-2) ,则称此随机变量为连续随机变量,或连续型随机变量,其中a可以是,b 可以是+ 。
[例1.2-1][例1.2-1] 产品的质量特性是表征产品性能的指标,产品的性能一般都具有随机性,所以每个质量特性就是一个随机变量。
例如:(1) 设x是一只铸件上的瑕疵数,则x是一个离散随机变量,它可以取0,1,2,…等值。
为了方便,人们常用随机变量x的取值来表示事件,如“x=0”表示事件“铸件上无瑕疵”;“x=2”表示事件“铸件上有两个瑕疵”;"x>2"表示事件“铸件上的瑕疵超过两个"等等。
这些事件可能发生,也可能不发生,因为x取0,1,2 …等值是随机的。
类似地,一平方米玻璃上的气泡数、一匹布上的疵点数、一台车床在一天内发生的故障数都是取非负整数 {0,1,2,3,…}的离散随机变量。
(2) 一台电视机的寿命x(单位:小时)是在[0,∞)上取值的连续随机变量。
"x=0" 表示事件"一台电视机在开箱时就发生故障";"x 10000" 表示事件:"电视机寿命不超过10000 小时";"x>40000" 表示事件"电视机寿命超过40000小时"。
(3) 检验一个产品,结果可能是合格品,也可能是不合格品。
设x表示检验一个产品的不合格品数,则x是只能取0或1两个值的随机变量。
"x=0"表示产品是合格品,"x=1" 表示产品是不合格品。
类似地,若检验10个产品,其中不合格品数x是仅可能取0,1,…,10等11个值的离散随机变量。
更一般的,在n个产品中的不合格品数x是可能取0,1,2,…,n等n+1 个值的离散随机变量。
二、随机变量的分布二、随机变量的分布(p15-20)虽然随机变量的取值是随机的,但其本质上还是有规律性的,这个规律性可以用分布来描述。
认识一个随机变量x的关键就是要知道它的分布,分布包含如下两方面内容:(1) x 可能取哪些值,或在哪个区间上取值。
(2) x 取这些值的概率各是多少,或x在任一区间上取值的概率是多少?下面分离散随机变量和连续随机变量来叙述它们的分布,因为这两类随机变量是最重要的两类随机变量,而它们的分布形式是有差别的。
(一) 离散随机变量的分布离散随机变量的分布可用分布列来表示,比如,随机变量x仅取n个值: ,随机变量取的概率为取的概率为,…,取的概率为p n 。
这些可用一张表清楚地表示:或用一个简明的数学式子表示: 作为一个分布,满足以下两个条件: 满足这两个条件的分布称为离散分布,这一组也称为分布的概率函数。
[例1.2-2 ][例1.2-2 ] 掷两颗骰子,点数分布的样本空间为:考察与这个随机现象有关的一些随机变量:(1)设x表示“掷两颗子骰子,6点出现的个数”,它的分布列为:(2)设y表示“掷两颗子,出现的点数之和”这些随机变量x, y 都是各从一个侧面表示随机现象的一种结果,每个随机变量的取值都是随机的,但其分布告诉我们该随机变量取每个值的概率,使人们不仅对全局做到心中有数,而且还看到了取哪些值的可能性大,x取哪些值的可能性小,比如:x取0可能性最大,x取2的可能性最小;y取7的可能性最大,y取2或12的可能性最小;这些分布中的概率都可用古典方法获得,每个概率都是非负的,其和均为1。
[例1.2-3][例1.2-3]设在10个产品中有2个不合格品,从中随机取出4个,其中不合格品数x 是离散随机变量,它仅可取0,1,2 等三个值。
x取这些值的概率为 (详见例1.1-4):具体计算后可得如下分布列:从表中可见,事件 "x=l" 出现的机会最大。
对同样的问题,若用放回抽样,则从10个产品(其中有2个不合格品)中随机取出4个,其中不合格品数y是另一个随机变量,它可取0,1,2,3,4 等五个值。
y取这些值的概率为(详见例1.1-6):m=0,1,2,3,4具体计算后可得如下分布列:这个分布显示了y取哪些值概率大,哪些值概率小。
还可计算有关事件的概率,比如:例[1.2-4][例1.2-4]某厂生产的三极管,每100 支装一盒,记x为一盒中不合格品数,厂方经多次抽查,根据近千次抽查的记录,用统计方法整理出如下分布:从这个分布可以看出,最可能发生的不合格品数在1到3之间,而超过5个不合格品的概率很小。
实际上,这两个事件的概率分别为:(二) 连续随机变量的分布(二) 连续随机变量的分布连续随机变量x的分布可用概率密度函数p(x)表示。
下面以产品的质量特性x,(如加工机械轴的直径)为例来说明p(x)的由来。
假定我们一个接一个地测量产品的某个质量特性值x, 把测量得到的x值一个接一个地放在数轴上。
当累积到很多x值时,就形成一定的图形,为了使这个图形得以稳定,把纵轴改为单位长度上的频率,由于频率的稳定性,随着被测质量特性值x的数量愈多,这个图形就愈稳定,其外形显现出一条光滑曲线。
这条曲线就是概率密度曲线,相应的函数表达式p(x)称为概率密度函数,它就是一种表示质量特性x随机取值的内在统计规律性的函数。
概率密度函数概率密度函数p(x)有多种形式,有的位置不同,有的散布不同,有的形状不同。
这些不同的分布形式反映了质量特性总体上的差别,这种差别正是管理层应该特别关注之处。
这里应强调的是:图上的纵轴原是“单位长度上的频率”,由于频率的稳定性,可用概率代替频率,从而纵轴就成为 "单位长度上的概率",这就是概率密度的概念,故最后形成的曲线称为概率密度曲线。
概率密度函数p(x)是连续随机变量特有的概念,它有如下性质。
(1)p(x)一定位于x轴上方,即p(x) > 0。
(2)p(x)与x轴所夹的面积恰好为1,即(3) 连续随机变量(3) 连续随机变量x在区间[a, b] 上的取值的概率为概率密度曲线下,在区间[a, b] 上所夹的曲边梯形面积 (见图1.2-3) 。
(4) 连续随机变量x取一点的概率为零,即p(x=a)=0,因为在一点上的积分永远为零。
(5)(5) ,这是因为,后者为零即得。
(6) 连续随机变量x 的分布函数f(x) 可用其密度函数算得,即所谓分布函数f(x) 就是概率密度函数从负无穷到x的积分,它表示随机变量取值从负无穷到x的概率,或相应区间的积分面积。
[例1.2-5 ][例1.2-5 ]考试得分是一个随机变量,下面是三个不同地区同一课程考试得分的概率密度函数 (见图1.2-4) 。
得分可以取0到100 分中的任意值,及格是50分,对每一地区,及格率大约是0.5 呢?还是大大超过0.5 ?还是大大低于0.5?解:在图1.2-4 上的50分处引一条垂线,则及格概率是:从50到100 之间的面积从图1.2-4 上可以看出: 地区(a) 的及格概率大大超过0.5 。
图1.2-4 三个地区考试得分的概率密度函数地区(b) 的及格概率大大低于0.5 。
地区(c) 的及格概率约为0.5 。
〔例1.2-6 〕〔例1.2-6 〕用指数函数表示的概率密度函数称为指数分布,它是一个常用分布,记为exp(λ),其中λ>0。
实际中不少产品发生失效的时间,或发生故障后需要维修的时间都服从指数分布,例如某厂生产的推土机发生故障后的维修霎时间t(单位:分)服从指数分布exp(0.02)。
其概率密度函数为:现转入现转入寻求一些事件的概率,在上述假定下,该推土机在100 分钟内完成维修的概率是图1.2-5 上左侧的一块阴影面积,这块面积可用积分计算:在计算面积时,一条直线的面积为0,在这个例子中p(t=100)=0即推土机完成维修时间不早不迟恰好在100 分钟的概率为0。
该推土机发生后在100 到300 分钟内完成维修的概率为:类似的:上述计算结果表明:此种推土机的86.47% 故障可在100 分钟内修好,有13.29% 的故障可在100 分钟到300 分钟修好,而超过300 分钟才能修好的故障只有0.24% 。
三、随机变量分布的均值、方差与标准差三、随机变量分布的均值、方差与标准差随机变量x的分布 (概率函数或密度函数)有几个重要的特征数,用来表示分布的集中位置 (中心位置)和散布大小。
1.均值:用来表示分布的中心位置,用e(x) 表示。
譬如e(x)=5 ,意味着随机变量x的平均值为5。
对于绝大多数的随机变量,在均值附近取值的机会较多。
它的计算公式是:其中xi,pi,和p(x)与上一小段中符号含义相同,这里不再重复。
2.方差:用来表示分布的散布大小,用var(x) 表示,方差大意味着分布的散布程度较大,也即比较分散,方差小意味着分布的散布程度小,也即分布较集中。
方差的计算公式是:3.标准差:方差的量纲是x的量纲的平方,为使表示分布散布大小的量纲与x的量纲相同,常对方差开平方,记它的正平方根为或,并称它为x的标准差:由于与x的量纲相同,在实际中更常使用标准差表示分布的散布大小,但它的计算通常是通过先计算方差,然后开方获得。
[例1.2-7][例1.2-7]现在来计算[例1.2-2]的有关分布的均值、方差和标准差。
在[例1.2-2]中随机变量“掷两粒骰子,点数之和y”的均值、方差和标准差分别为:[例1.2-8][例1.2-8]看图识方差(与标准差)。
图1.2—6(a) 、(b) 、(c) 、(d)上画出四个离散分布的线条图,其中垂线高度就是相应的概率。
现问这四个分布中哪个方差大,哪个方差小。
由方差的定义知:其中。
若要方差小,则和式中每一项都要小,这要求:(1) 若偏差-e(x) 的绝对值小,则相应概率可以大一些;(2) 若偏差-e(x) 的绝对值大,则相应概率必定要小。
这意味着:离均值e(x) 近的值发生的可能性大,远离均值e(x) 的值发生的可能性小,正如图1.2—6(d) 所示。
反之,若要方差大,则和式中必有某些乘积项较大,也就是说,有若干个大偏差-e(x) 发生的概率大,或者说远离均值e(x) 的值发生的可能性大,正如图1.2—6(a) 所示。
从上述说明可以看出图1.2—6上四个离散分布的方差(从而标准差)从上到下是逐渐减小的。
类似地,对连续分布也有类似解释,故图1.2—6(e) 、(f) 、(g)、(h) 上四个连续分布的方差(或标准差)从上到下也是逐渐减小的。