当前位置:文档之家› 第三章 多元正态分布

第三章 多元正态分布


1.简单相关系数
❖ 相关系数ρij的极大似然估计为
n

rij
ˆij

ˆii ˆ jj
sij

sii s jj
(xki xi )(xkj x j )
k 1
n
n
(xki xi )2
(xkj x j )2
k 1
k 1
其中 Σˆ
ˆij
,x

y : Nr Cμ b,CΣC
➢ 该性质表明,(多元)正态变量的任何线性变换仍 为(多元)正态变量。
❖ 例3.2.2 设x~Np (μ, Σ),a为p维常数向量,则由上 述性质(2)或(3)知,
ax : N aμ,aΣa
❖ (4)设x~Np (μ, Σ),则x的任何子向量也服从(多 元)正态分布,其均值为μ的相应子向量,协方差 矩阵为Σ的相应子矩阵。
3 0 0
Σ


0 0
5 1
11
则x2和x3不独立,x1和(x2,x3)独立。
❖ *(8)略
❖ *(9)略
❖ *(10)略
❖ (11)设x~N p (μ, Σ), Σ>0,作如下剖分
x


x1 x2

k p
, k
μ


μ1 μ2

k p
ijgk 1,L , p
ijgk 1,L , p
,
iigk 1,L , p jjgk 1,L , p
1 i, j k
其中Σ11g2 ijgk1,L , p 。
❖ ρij∙k+1,⋯,p度量了剔除xk+1, ⋯,xp的(线性)影响之后, xi和xj间相关关系的强弱。
➢ 该性质说明了多元正态分布的任何边缘分布仍为 (多元)正态分布。
➢ 需注意,随机向量的任何边缘分布皆为(多元)正 态分布未必表明该随机向量就服从多元正态分布。 例2.2.2就是这样的一个反例。
❖ 还需注意,正态变量的线性组合未必就是正态变量。
➢ 这是因为:
x1,x2, ⋯,xn均为一元正态变量 ⟸(⇏)x1,x2, ⋯,xn的联合分布为多元正态分布 ⟺x1,x2, ⋯,xn的一切线性组合是一元正态变量 ❖ 例3.2.4 设x~N4(μ, Σ),这里
(ii)

x1 x4

:
N
2


1 4

,

11 41
14 44



x4
4 44 41 43
(iii)

x1 x3

:
N
3


1 3

第三章 多元正态分布
❖ §3.1 多元正态分布的定义 ❖ §3.2 多元正态分布的性质 ❖ §3.3 复相关系数和偏相关系数 ❖ §3.4 极大似然估计及估计量的性质 ❖ §3.5 x 和(n − 1) S的抽样分布 ❖ *§3.6 二次型分布
§3.1 多元正态分布的定义
❖ 一元正态分布N(μ,σ2)的概率密度函数为
, 1
Σ

11

σ21
1
σ21 1
Σ
22

p

1
p 1
❖ x1和x2的线性函数 lx2间的最大相关系数称为 x1和x2 间的复(或多重)相关系数(multiple correlation
coefficient),记作ρ1∙2,⋯,p, 它度量了一个变量x1与一 组变量x2, ⋯,xp间的相关程度。
❖ 可推导出
1g2,L
,p

max l0
x1, lx2


σ
21
Σ
σ 1
22 21
11
1

2
❖ 例3.3.1 随机变量x1,⋯,xp的任一线性函数F=l1x1+⋯+
lp xp与x1,⋯,xp的复相关系数为1。
➢ 证明
Q
F g1,L
,p

max a0
❖ 对于多元正态变量x,由于Σ11∙2也是条件协方差矩阵 ,故此时偏相关系数与条件相关系数是同一个值,
从而ρij∙k+1,⋯,p同时也度量了在xk+1, ⋯,xp值给定的条件 下xi和xj间相关关系的强弱。
§3.4 极大似然估计及估计量的性质
❖ 本课程第二章和第三章前三节的内容属概率论的范 畴。
❖ 从第三章§3.4 开始的内容属数理统计的范畴,特点 是推断和分析从样本出发。
12 1 2


1 2

2 2


易见,ρ是x1和 x2的相关系数。当|ρ|<1时,可得x的 概率密度函数为
f

x1,
x2


1
21 2
1
2
exp 2
1
1 2

x1 1 1
2

2

x1 1 1
❖ 一、复相关系数 ❖ 二、偏相关系数
一、复相关系数
❖ (简单)相关系数度量了一个随机变量x1与另一个 随机变量x2之间线性关系的强弱。
❖ 复相关系数度量了一个随机变量x1与一组随机变量 x2, ⋯,xp之间线性关系的强弱。
❖ 将x, Σ(>0)剖分如下:
x


x1 x2

1 p

x1, x2,L
, xp
,S

1 A n 1
sij

称S为样本协方差矩阵、rij为样本相关系数、Rˆ rij
为样本相关矩阵。
2.复相关系数
❖ 将x, Σ(>0),S剖分如下:
x


f x
1
x 2

e 2 2
2
2 1 2
2
1
2
exp


1 2

x



2
1 x ,
x
❖ 若随机向量 x (x1, x2,L , xp )的概率密度函数为
f
x 2 p
2
Σ
x1
1
11 12 13 14
x


x2
,
μ


2
,
Σ



21
22
23

24

x3
3
31 32 33 34

x4


4



41
42
43

44


(i) xi : N i ,ii , i 1,2,3,4;
,

14 34
11 31

13 33


§3.2 多元正态分布的性质
❖ (5)设x1,x2, ⋯,xn相互独立,且xi~N p (μi, Σi) , i=1,2,⋯,n,则对任意n个常数,有
n
ki xi :
N
p

n
ki μi ,
n
ki2
Σi
F, a1x1 L
apxp
F,l1x1 L lpxp 1
F g1,L , p 1
二、偏相关系数
❖ 将x, Σ(>0)剖分如下:
x


x1 x2

k p

k
,
Σ


Σ11 Σ 21
Σ12 k
Σ
2
2

p

k
k pk
称Σ11g2 Σ11 Σ12 Σ221Σ21为给定x2时x1的偏协方差矩
❖令
x1 x11 x12 L x1p
X


x2



x21
x22
L
x2
p

M M M
M

xn


xn1
xn 2
L
xnp

称之为(样本)数据矩阵或观测值矩阵。
一、样本x1,x2, ⋯,xn的联合概率密度
❖ 极大似然估计是通过似然函数来求得的,似然函数
可以是样本联合概率密度 f (x1,x2,⋯,xn)的任意正常 数倍,我们不妨取成相等,记为L(μ, Σ)。可具体表 达为:
n
L μ, Σ f x1, x2,L , xn f xi i1

n
2 p 2
i1
Σ
1
2
exp

1 2

xi

μ
Σ
n i1
xi x 2
L μˆ, Σˆ max L μ, Σ μ,Σ
μˆ x, Σˆ 1 A n
其中x 称为样本均值向量(简称为样本均值),
n
A xi x xi x 称为样本离差矩阵。 i 1
三、相关系数的极大似然估计
❖ 1. ❖ 2. ❖ 3.偏相关系数
k
,
Σ


Σ11 Σ 21
Σ12 k
Σ
2
2

p

k
k pk
则给定x2时x1的条件分布为 Nk μ1g2 , Σ11g2 ,其中
相关主题