1、数理统计基础1.1 随机变量1.1.1随机事件和概率观测或试验的一种结果,称为一个事件。
在一定条件下进行大量重复试验时,每次都发生的事件,称为必然事件(Ω);反之,每次都不发生的事件,称为不可能事件(Φ);有时发生有时不发生的事件,称为随机事件或偶然事件(A )。
随机事件的特点是在一次观测或试验中,它可能出现,也可能不出现,但在大量重复观测或试验中呈现统计规律性。
用来描述事件发生可能性大小的量就是概率。
概率的统计定义是:在相同条件下进行n 次重复试验,事件A 发生了m 次,称m 为事件的频数,称m /n 为事件的频率。
当n 足够大时,频率m /n 稳定地趋向于某一个常数p ,此常数p 称为事件A 的概率,记为)(A P =p ,即:)(A P =nm n ∞→lim =p (1.1) 即概率是频率的极限值。
由概率的定义可归纳出概率的三个基本性质:(1)必然事件Ω的概率等于1,即)(Ωp =1;(2)不可能事件Φ的概率等于0,即)(Φp =0;(3)任何事件的概率都介于0和1之间,即0≤)(A P ≤1。
小概率原理:当某一事件的概率非常接近于0时,说明这个事件在大量的试验中出现的概率非常小,这样的事件称为小概率事件。
小概率事件虽然不是不可能事件,但在一次连续试验中出现的可能性很小,一般可以认为不会发生,此即为小概率原理。
概率的三个定理:(1)互补定理:某事件发生的概率与不发生的概率之和为1。
当发生的概率为p,则不发生的概率为1-p。
全部基本事件之和为必然事件。
(2)加法定理:相互独立而又互不相容的各个事件,其概率等于它们分别出现之和。
例如,A1,A2,…An为相互独立而又互不相容的事件,其中任一事件出现的概率为各个事件概率的总和,即P(A)=P(A1)+P(A2)+…+P(An)=∑=niiAP1)((1.2)(3)乘法定理:相互独立的事件同时发生的概率是这些事件各自发生的概率的乘积,即P(A1A2…An)=P(A1)P(A2)…P(An)=∏=niiAP1)((1.3)1.1.2 随机变量与分布函数每次试验的结果可以用一个变量X的数值来表示,这个变量的取值随偶然因素而变化,但又遵从一定的概率分布规律,这种变量称为随机变量。
随机变量根据其取值的特征可以分为离散型随机变量和连续型随机变量。
离散型随机变量试验结果的可能值可以一一列举出来,即随机变量X可取的值是间断的、可数的。
连续型随机变量试验结果的可能值不能一一列举出来,即随机变量X可取的值是连续充满在一个区间的。
随机变量的特点是以一定的概率在一定的区间范围内取值,但并不是所有的观测值都能以一定的概率取某一固定值。
因此人们关心的是随机变量在某一个区间取值的概率是多少?即P(a≤X≤b)=?根据概率的加法定理,某随机变量X在区间[a,b]的取值概率为:P(a≤X≤b)=P(X<b)-P(X<a)显然只要求出P(X<b)和P(X<a)即可,这比求出P(a≤X≤b)简单得多。
对于任何实数x,事件(X<x)的概率当然是x的函数,令F(x)=P(X <x)表示(X<x)的概率,并定义F(x)为随机变量X的概率分布函数,用来描述随机变量的统计规律。
分布函数F (x )完全决定了事件(a ≤X ≤b )的概率。
连续型随机变量X 的分布函数的表达式为:)(x F =P (X <x )=⎰∞-xdx x f )( (1.4) 式中, )(x f 称为随机变量X 的概率密度函数(或简称概率密度)。
正态分布是连续型随机变量最常见的一种分布。
正态分布的概率密度函数)(x f 和概率分布函数)(x F 分别为:)(x f =222)(21σμπσ--x e (1.5))(x F =dx e xx ⎰∞---22)(21σμπσ (1.6)以X 的取值x 为横坐标,以概率密度函数)(x f 为纵坐标,正态分布的图象如图1.1所示。
图中的曲线即为概率密度函数)(x f ,积分区间内的曲线与横轴之间所包含的面积就是概率分布函数)(x F ,亦即随机变量X 的概率。
图1.1 正态分布示意图)(x f 的图象具有如下性质:a 、μ为随机变量X 一系列取值的中位值(或称均值),)(x f 对称于直线x =μ,且)(x f >0,曲线位于横轴的上方。
它向左右无限延伸,并以横轴为渐近线。
b 、当x =μ时,)(x f 取最大值: σπμ21)(=fx 离μ越远)(x f 越小,这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间上的概率越小。
c 、参数σ为曲线拐点的横坐标,其大小决定了正态曲线的形状特点,σ愈大曲线愈平缓,σ愈小曲线愈高陡。
可以看出,正态分布主要取决于μ和σ两个参数,称μ为随机变量X 的数学期望,σ2为随机变量X 的方差。
当随机变量X 服从正态分布时,常记作X ~N (μ,σ2)。
如令随机变量t =(x-μ)/σ,通过变量转换,可由一般正态分布推算得随机变量t 的概率密度函数)(t ϕ及相应的概率分布函数)(t Φ:)(t ϕ=2221t e-π (1.7) )(t Φ=dt e t t ⎰∞--2221π (1.8)这种分布称为标准正态分布,是正态分布中μ=0,σ2=1的特例。
当随机变量服从标准正态分布时,常记作X ~N (0,1)。
通常将t ~)(t Φ制成数值表,称t 为标准正态分布的分位数。
如已知t ,即可从表中查得相应的)(t Φ;反之,亦然。
标准正态分布与一般正态分布具有如下关系:)(x F =Φ)(σμ-x (1.9)因此,对于任意正态分布N (μ,σ2),当已知x ,需求相应的F (x )时,均可通过下式变换 σμ-=x t (1.10)算得对应于x 的t 值,再在标准正态分布函数数值表上查得相应的概率。
正态随机变量中有三个重要的概率值(见图1.2),它们分别是P (μ-σ<X ≤μ+σ)=0.6826,P (μ-2σ<X ≤μ+2σ)=0.9544,P (μ-3σ<X ≤μ+3σ)=0.9973。
图1.2 正态分布的三个重要概率值注意到第三个概率值,对于正态随机变量X 来说,它落在μ±3σ内的概率约为99.7%,落在μ±3σ外的概率约为0.3%。
可见,在具有正态分布特征的试验中,其数据落在μ±3σ以外的概率是很小的,可视为“小概率事件”。
因此,试验中一旦出现μ±3σ外的数据,根据“3σ规则”,即可将其认为是“可疑数据”而予以剔除,或是工艺过程出现异常,应予注意。
[例1.1] 已知一批强度等级为C25的混凝土,其试件的抗压强度平均值为30.0MPa,标准差为5.0MPa,设该混凝土的抗压强度R 服从N(30.0,5.0)的正态分布,试计算抗压强度高于25.0MPa 的概率(即求该混凝土的强度保证率)。
[解] P (R ≥25.0)=1-P (R <25.0)=1-)(t Φ=1-)0.50.300.25(-Φ =1-)0.1(-Φ=1-0.1587=0.8413即该批混凝土的强度保证率为84.1%。
由此可见,对于标准差为5.0MPa 的C25混凝土,即使其抗压强度平均值为30.0MPa 时,仍不能达到相关规范所规定的95%的强度保证率。
[例1.2] 条件同[例1.1],其试件抗压强度平均值m 为多少时,才能使该混凝土的强度保证率达到95%?[解] 由 P (R ≥25.0)=1-P (R <25.0)=0.95得 t =0.50.25m -=-1.645 m =25.0+1.645×5.0=33.2MPa上式中,t 被称为强度保证率系数,它对应于95%的强度保证率。
1.2 随机变量的数字特征由上所述,利用分布函数或分布密度函数可以完全确定一个随机变量。
但在实际问题中,求分布函数或分布密度函数不仅十分困难,而且常常没有必要。
用一些数字来描述随机变量的主要特征,显得十分方便、直观、实用。
描述随机变量某种特征的量称为随机变量的数字特征。
1.2.1 数学期望数学期望又称均值,记作E (X ),其计算公式为:当X 为离散型时 ∑∞==1)(i i i p x X E (1.11)当X 为连续型时 ⎰∞∞-=dx x xf X E )()( (1.12)数学期望描述了随机变量的取值中心,但它不是简单的算术平均,而是以概率为权的加权平均。
数学期望有如下性质(下式中c 、k 、b 均为常数):(1)E (c )=c (1.13a )(2)E (kX )=kE (X ) (1.13b )(3)E (X+b )=E (X )+b (1.13c )(4)E (kX+b )=kE (X )+b (1.13d)(5)E (X+Y )=E (X )+E (Y ) (1.13e )(6)E (XY )=E (X )E (Y )+Cov (X ,Y ) (1.13f ) 称Cov (X ,Y )为协方差,当X ,Y 相互独立时,Cov (X ,Y )=0,则有 )()()(Y E X E XY E = (1.13g )1.2.2 方差记作D (X ):D (X )=E{[X-E (X )]2}=E (X 2)-[E (X )]2 (1.14) 方差描述了随机变量X 取值对于数学期望E (X )的离散程度。
1、方差的计算公式当X 为离散型时 ∑-=i i p X E x X D 2)]([)( (1.15) 当X 为连续型时 ⎰∞∞--=dx x f X E x X D )()]([)(2 (1.16)2、方差的性质(下式中a 、b 、c 、k 为常数)(1)D (c )= 0 (1.17a )(2)D (kX )= k 2D (X ) (1.17b )(3)D (X+b )= D (X ) (1.17c )(4)D (kX+b )= k 2D (X ) (1.17d )(5)D (X+Y )= D (X )+D (Y )+ 2Cov (X ,Y ) (1.17d ) 当X ,Y 相互独立时,协方差Cov (X ,Y )= 0,则有:D (X+Y )= D (X )+D (Y ) (1.17e )(4)、(5)可推广至随机变量X 1,X 2,…,X n 。
1.3 随机变量的基本定理1.3.1 大数定理设X 1,X 2,…,X n 是独立同分布的随机变量列,且E (X 1)、D (X 1)存在,则对于任何ε>0,有 {}1)(lim 1=-∞→ε<X E x P n (1.18)式中: ∑==nk i k x n x 1 (1.19)上式又称切比谢夫(Tchebyshev )定理。
大数定律的实际意义在于,只要n 充分大,算术平均值x 以很大的概率取值接近于数学期望,即当n 充分大时,可以用算术平均值x 代替真值)(1X E ,以满足测量不确定度ε的要求。