多元正态分布及参数估计
多元正态分布主要内容包括:
§2.1 多元(概率)分布基本概念 §2.2 多元正态分布定义及其性质 §2.3 多元正态分布的参数估计
1
众所周知,一元统计分析是多元统计分析的 基础,尤其是一元正态分布自然是多元正态 分布的基础,它在统计学的理论和实际应用 方面都有着重要的地位。
在一元统计分布中,经常会用到随机变量X 的概念及其概率分布问题。
F (x1, x2 ,..., x p ) P( X1 x1,..., X p x p )
14
联合密度函数的定义
对于多元连续型随机向量来说,其概率分 布也可以用密度函数来描述。
若存在一个非负的p元函数f(·),满足
x1 x p
F (x1,..., x p ) ... f (t1,...,t p )dt1...dt p
对于多元的随机向量,就对应地需要用联合分布函数 来刻画其概率分布。
11
二元随机向量的联合分布函数
定义: 设(X,Y)为二维随机变量,对任意实数 x,y,二
元函数 F(x, y) P(X x,Y y)
称为二维随机变量(X,Y)的联合分布函数.
如果把(x,y)看成是平面上随机点的坐标,则联合分布函数 F(x, y) 在点(x,y)处的函数值就是随机点(X,Y)落在平面上的 矩形区域 G {(X ,Y ) | X x, Y y}的概率.
因而多元随机向量可看作是一元随机变量的推广 而一个随机变量可看作是特殊的一元随机向量.
4
§2.1 多元(概率)分布基本概念
1.二元随机向量的例子
由于我们的研究对象涉及的是多个变量的总体,所 以要用若干个随机变量合在一起看作一个整体,共 同用这个整体来描述随机现象。
•比如,要考察一射击手向一平面靶子射击的水平, 那么,子弹在靶子上的着点位置是随机的,这个平 面上的随机点需要用两个随机变量(即横向的X与纵 向的Y)共同来描述,于是(X,Y)就构成了二元(维) 的随机向量。
2
(1)随机变量的定义:对于每一个随机结果都对 应着某个变量的一个数值,这种对应就是一个函数, 用随机变量来表示。
R.V.特点: a.取值的随机性,即事先不能确定其取哪一个值; b.取值的统计规律性,即完全可以确定x取某个值或
在某个区间内取值的概率。
3
有时候,仅仅用一个随机变量来描述随机现象就 不够了,需要用多个随机变量来共同描述的随机 现象和问题,而且这些随机变量间又有联系,所 以必须要将它们看做一个整体来研究(即不能一 个一个地单独研究多个一元随机变量),这就出 现了多元随机向量的问题和概念.
16
3.p元随机向量的数字特征
随机向量的数字特征主要有均值向量和协方差矩阵。 1.均值向量就是每一个分量的均值(或叫期望)所组成
的常数向量。用数学符号表示如下: 设p元随机向量为 X ( X1, X 2 ,..., X p ) ,且每个分量的
期望为 E( X i ) i , i 1,..., p ,则将新向量:
对任意的 (x1, x2 ,...,xp ) R p
都成立,则称p元函数f(·)为p元随机向量的 概率密度函数,并称随机向量为连续型的。
15
联合概率密度函数的基本性质
两条性质是:
f (x1 ,..., x p ) 0, 对任意 实数x1 ,..., x p都成立
... f (t1 ,..., t p )dt1...dt p 1
12
二元联合分布函数的几何意义演示图:
F(x,y)=
Y
P(X≤x,Y≤y)
y
(x,y)
{ X≤x , Y≤y } x
X
F(x,y)值为随 机点落入黄色 矩形区域内的 概率
13
对于p元的随机向量来说,就对应地需要用 联合分布函数来刻画其概率分布。
联合分布函数的定义: 设 X ( X 1, X 2 ,..., X p ) 是一随机向量,它的 联合分布函数定义为
8
P元ห้องสมุดไป่ตู้维)随机向量的定义
设 X 1 , X 2 ,..., X p 为p个随机变量, 将它们合在一起组成的一个整体的向量 X ( X 1, X 2 ,..., X p )
称作p元随机向量。 注意:X是列向量,所以横着写时需要转
置一下。
9
2.联合分布函数与密度函数
与一元随机变量一样,也可将随机向量分为离散性和 连续型两类,但是在表达其概率分布时,就非常不方 便了(因为当它是离散型时,需要用多维表格表示概 率分布,但超过两维时就不容易表示了),这时我们 就必须借助于分布函数来刻画它的概率分布。这就充 分体现出分布函数在表达联合概率分布时的优势。
5
射击后的子弹着落点的位置 是随机的
这个点的位置要用两个 随机变量X与Y共同描 述才能确定,即用(X, Y)数组的取值来确定 这个点的位置。
Y
X
·A
这就是二元随机向量。
6
P元(维)随机向量
在研究社会、经济现象和许多实际 问题时,经常遇到多指标的问题。
例如,评价学生在校表现时,要考 察他的政治思想(德)、学习情况 (智)、身体状况(体)等各个方 面的情况,仅学习情况就又涉及他 在各个年度的每门课程成绩,这里 面就有多项指标存在。
E( X ) (E( X1 ), E( X 2 ),..., E( X p ))
定义为该随机向量的期望,也叫均值向量. 而一元随机变量的第一个数字特征名称却称为均值或期 望.请注意一元与多元在对应概念上的称呼的区别.
17
P元随机向量的协方差阵
注意:一元随机变量与多元随机向量在第二个数字 特征方面的表示有很大不同,其原因是在多元情形 中还要体现出分量之间的相关关系。
7
再例如,研究公司的经营情况,就要考察资 金周转能力、偿债能力、获利能力、竞争力 等多个指标。显然不能将这些指标分割开来 进行单独研究,那样就不能从整体上综合把 握事物的实质。
一般地,假设我们研究的问题涉及p个指标, 对n个个体进行观察,就会得到n×p个数据, 我们的目的就是对观测对象进行分组、分类、 或分析考察这p个变量之间的相互关联程度, 或者找出内在规律性等等。
一元的称为方差,而多元的改称为协方差阵。
以二元的为例,就会出现两个分量之间的协方差的 概念。