当前位置:
文档之家› 厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计
厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计
+∞ +∞
( 2) )
−∞ −∞
∫∫
e − ( x1 + x2 ) dx1dx2 =
+∞ +∞
∫∫
0 0
e − ( x1 + x2 ) dx1dx2
=
=
+∞
∫
0
0 +∞
+∞ − ( x1 + x2 ) dx1 dx2 ∫ e 0
− x2
∫e
dx2 = − e
− x2 +∞ 0
=1
维随机向量, 定义 2.4 设 X = ( X 1 , X 2 ,L , X p )′ 是 p 维随机向量,称 由 它 的 q (< p ) 个 分 量 组 成 的 子 向 量 的边缘( 或边际) X (i ) = ( X i1 , X i2 ,L , X iq )′ 的分布为 X 的边缘( 或边际 ) 分布, 的分布称为联合分布。 分布 ,相对地把 X 的分布称为联合分布。通过变换 X 中 各分量的次序, 总可假定 X (1) 正好是 X 的前 q 个分量, 个分量, 各分量的次序, 其 余 p − q 个分量为 X
f ( x1 , x 2 , L , x p ) , 使 得 对 一 切 x = ( x1 , x2 , L, x p )′ ∈ R p 有
F ( x)∆F ( x1 , x2 ,L , x p ) =
x1
xp
−∞
∫L∫
f (t1 , t2 ,L , t p )dt1 L dt p (2.3) )
−∞
表 2.1 变量 序号 1 2
数据
X1
X2
L
Xp
X 11
X 12
L L
M
X1 p X2p
X 21
X 22
M
M
X n1
M
X n2
M
X np
n
L
X (α ) = ( X α 1 , X α 2 ,L , X α p )′ , α = 1, 2,L , n 个样品的观测值。 表示第 α 个样品的观测值。竖看表 2.1,第 j 列的元素 , X j = ( X 1 j , X 2 j ,L , X nj )′ , j = 1, 2,L , p
【例 2.1】 试证函数 】
e − ( x1 + x2 ) , x1 ≥ 0, x 2 ≥ 0 f ( x1 , x 2 ) = 其它 0, 密度函数。 为随机向量 X = ( X 1 , X 2 )′ 密度函数。
证:只要验证满足密度函数两个条件即可 ( 1)显然,当 x1 ≥ 0, x 2 ≥ 0 时有 f ( x1 , x 2 ) ≥ 0 )显然,
(2.1) )
简记为 X。 。 定义 2.1 将 p 个随机变量 X 1 , X 2 ,L , X p 的整体称为 p 维随 机向量, 机向量,记为 X = ( X 1 , X 2 ,L , X p )′ 。 在对随机向量的研究仍然限于讨论离散型和连续型两类随机 向量。 向量。
二、多元分布
先回顾一下一元统计中分布函数和密度函数的定义。 先回顾一下一元统计中分布函数和密度函数的定义。 是一个随机变量, 设 X 是一个随机变量,称 F ( x) = P ( X ≤ x ) 为 X 的概率分布 若 随 机 变 量 在 有 限 或 可 列 个 值 {x k } 上 取 值 , 记 函数或简称为分布函数, 函数或简称为分布函数,记为 X ~ F ( x ) 。
−∞ −∞
求边缘密度函数。 【例 2.2】对例 2.1 中的 X = ( X 1 , X 2 )′ 求边缘密度函数。 】 解:
f ( x1 ) =
+∞
−∞
∫ f (x , x
1
2
) dx 2
+∞ − ( x1 + x2 ) e dx2 = e − x1 , x1 ≥ 0 ∫ = 0 0, 其它
在实用中遇到的随机向量常常是服从正态分布或近似正态分 布,或虽本身不是正态分布,但它的样本均值近似于正态分 或虽本身不是正态分布, 布。因此现实世界中许多实际问题的解决办法都是以总体服 从正态分布或近似正态分布为前提的。在多元统计分析中, 从正态分布或近似正态分布为前提的。在多元统计分析中, 多元正态分布占有很重要地位, 多元正态分布占有很重要地位,本书所介绍的方法大都假定 数据来之多元正态分布。为此, 数据来之多元正态分布。为此,本章将要介绍多元正态分布 的定义和有关性质。 的定义和有关性质。 然而在实际问题中, 然而在实际问题中,多元正态分布中均值向量和协差阵通 常是未知的,一般的做法是由样本来估计。 常是未知的,一般的做法是由样本来估计。这是本章讨论的 重要内容之一, 重要内容之一,在此我们介绍最常见的最大似然估计法对参 数进行估计,并讨论其有关的性质。 数进行估计,并讨论其有关的性质。
为连续型随机变量, 则称 X 为连续型随机变量,称 f ( x1 , x 2 , L , x p ) 为分布密度函 数,简称为密度函数或分布密度。 简称为密度函数或分布密度。 一个 p 元函数 f ( x1 , x 2 , L , x p ) 能作为 R p 中某个随机向量的 密度函数的主要条件是: 密度函数的主要条件是: ( 1) f ( x1 , x 2 , L , x p ) ≥ 0 , ∀( x1 , x 2 ,L, x p )′ ∈ R ; )
第二章 多元正态分布的参数估计
第一节 第二节 第三节 第四节 第五节 引言 基本概念 多元正态分布 多元正态分布的参数估计 多元正态分布参数估计的 实例与计算机实现
第一节 引言
多元统计分析涉及到的都是随机向量或多个随机向量放在一 起组成的随机矩阵。例如在研究公司的运营情况时,要考虑 起组成的随机矩阵。例如在研究公司的运营情况时, 公司的获利能力、资金周转能力、 公司的获利能力、资金周转能力、竞争能力以及偿债能力等 财务指标;又如在研究国家财政收入时,税收收入、 财务指标;又如在研究国家财政收入时,税收收入、企业收 债务收入、国家能源交通重点建设基金收入、 入、债务收入、国家能源交通重点建设基金收入、基本建设 贷款归还收入、国家预算调节基金收入、 贷款归还收入、国家预算调节基金收入、其他收入等都是需 要同时考察的指标。显然,如果我们只研究一个指标或是将 要同时考察的指标。显然, 这些指标割裂开分别研究, 这些指标割裂开分别研究,是不能从整体上把握研究问题的 实质的,解决这些问题就需要多元统计分析方法。 实质的,解决这些问题就需要多元统计分析方法。为了更好 的探讨这些问题, 的探讨这些问题,本章我们首先论述有关随机向量的基本概 念和性质。 念和性质。
p
+∞
( 2) L )
−∞
∫ ∫ f (x , x
1 −∞
+∞
2
, L , x p )dx1 L dx p = 1
离散型随机向量的统计性质可由它的概率分布完全确定, 离散型随机向量的统计性质可由它的概率分布完全确定,连续 型随机向量的统计性质可由它的分布密度完全确定。 型随机向量的统计性质可由它的分布密度完全确定。
P ( X = xk ) = pk , (k = 1, 2,L) 且 ∑ p k = 1 ,则称 X 为离散
k
型随机变量, 型随机变量,称 P ( X = xk ) = pk ,( k = 1, 2,L) 为 X 的概率分 布。 设 X ~ F ( x) , 若存在一个非负函数 f (x) , 使得一切实数 x 有:
(Hale Waihona Puke )X ,则 X = (2) , X p −q
(1)
q
x (1) 相应的取值也可分为两部分 x = (2) 。 x
当 X 的分布函数是 F ( x1 , x2 ,L , xq ) 时, X (1) 的分布函数即边 缘分布函数为: 缘分布函数为:
F ( x1 , x2 ,L , xq ) = P ( X 1 ≤ x1 ,L , X q ≤ xq ) = P ( X 1 ≤ x1 ,L , X q ≤ xq , X q +1 ≤ ∞,L , X p ≤ ∞ ) = F ( x1 , x2 ,L , xq , ∞,L , ∞)
第二节 基本概念
一 随机向量
二 多元分布
三 随机向量的数字特征
一、随机向量
我们所讨论的是多个变量的总体,所研究的数据是同时 个 我们所讨论的是多个变量的总体,所研究的数据是同时p个 指标(变量),又进行了n次观测得到的 我们把这个p指标 ),又进行了 次观测得到的, 指标(变量),又进行了 次观测得到的,我们把这个 指标 表示为X 常用向量X 表示为 1 ,X2,…,Xp,常用向量 = (X1 , X2 , … , XP)' 表示对同一个体观测的p个变量 这里我们应该强调, 个变量。 表示对同一个体观测的 个变量。这里我们应该强调,在多 元统计分析中,仍然将所研究对象的全体称为总体, 元统计分析中,仍然将所研究对象的全体称为总体,它是由 许多(有限和无限)的个体构成的集合, 许多(有限和无限)的个体构成的集合,如果构成总体的个 体是具有p个需要观测指标的个体 我们称这样的总体为p维 个需要观测指标的个体, 体是具有 个需要观测指标的个体,我们称这样的总体为 维 总体( 元总体)。 总体(或p元总体)。上面的表示便于人们用数学方法去研 元总体)。上面的表示便于人们用数学方法去研 维总体的特性。 的概念, 究p维总体的特性。这里“维”(或“元”)的概念,表示 维总体的特性 这里“ 共有几个分量。若观测了n个个体 则可得到如表2.1的数据 个个体, 的数据, 共有几个分量。若观测了 个个体,则可得到如表 的数据, 称每一个个体的p个变量为一个样品 而全体n个样品组成一 个变量为一个样品, 称每一个个体的 个变量为一个样品,而全体 个样品组成一 个样本。 个样本。
(2.2) ) 记为 X ~ F ( x ) , 其中 x = ( x1 , x2 , L , x p )′ ∈ R , R 表