当前位置:文档之家› 协方差及相关系数分解

协方差及相关系数分解


P pq
0 <Байду номын сангаасp <1 p + q =1
XY 1 0 P pq
E( X ) p, E(Y ) p, D( X ) pq, D(Y ) pq,
E( XY ) p, D( XY ) pq,
cov( X ,Y ) pq, XY 1
例2
设( X ,Y )
~
N
(
μ1
,
μ2
,
σ12
,
σ
2 2
32 3
2
1. 3
D(Z ) D( X ) D(Y ) 2Cov( X ,Y )
3
2
32
1 D( X ) 1 D(Y ) 1 Cov( X ,Y )
9
4
3
1 9
D(
X
)
1 4
D(Y
)
1 3
ρXY
D( X )
D(Y )
1 4 2 3.
(2) Cov( X , Z ) Cov( X , X Y ) 32
2
σ
2 2
)2
y
.
2πσ2
E( X ) μ1, E(Y ) μ2, D( X ) σ12, D(Y ) σ22. 而
Cov( X ,Y )
(
x
μ1 )(
y
μ2
)
f
(
x,
y)d
x
d
y
1
2πσ1σ2 1 ρ2
(x
μ1 )(
y
μ2 )
e e d y d x.
(
x μ1 2σ12
D( X ) D(Y ) 2E{[X E( X )][Y E(Y )]}. 协方差
2. 定义
量 E{[X E( X )][Y E(Y )]} 称为随机变量 X 与 Y 的协方差. 记为 Cov( X ,Y ), 即
Cov( X ,Y ) E{[X E( X )][Y E(Y )]}.
例 3 已知随机变量X ,Y分别服从N (1,32 ), N (0,42 ), ρXY 1 2,设 Z X 3 Y 2.
(1) 求 Z 的数学期望和方差. (2) 求 X 与 Z 的相关系数.
解 (1)由E( X ) 1, D( X ) 9, E(Y ) 0, D(Y ) 16.
得 E(Z ) E( X Y ) 1 E( X ) 1 E(Y )
将 e 分别关于 a,b 求偏导数,并令它们等于零,得
e ae
2a 2bE( X ) 2E(Y ) 2bE( X 2 ) 2E( XY )
,
ρ),
试求
X
与Y

相关系数.
解 由 f (x, y)
1
2πσ1σ2 1 ρ2
1
exp
2(1
ρ2
)
( x
μ1 )2 σ12

(
x
μ1)( y σ1σ2
μ2 )
(
y
μ2 )2
σ
2 2
fX (x)
1
e ,
(
x μ1 2σ12
)2
x
,
2πσ1
fY ( y)
1
e ,
(
y μ2
设 e E[(Y (a bX ))2]
则 e 可用来衡量 a bX 近似表达 Y 的好坏程度. 当 e 的值越小,表示 a bX 与 Y 的近似程度越好.
确定 a,b 的值,使 e 达到最小.
e E[(Y (a bX ))2]
E(Y 2 ) b2E( X 2 ) a2 2bE( XY ) 2abE( X ) 2aE(Y ).
( 2) 二维正态随机变量 X 与Y 相关系数为零 等价于 X 与Y 相互独立.
5. 性质
(1) Cov(X ,Y ) Cov(Y , X ); (2) Cov( aX ,bY ) abCov( X ,Y ) , a, b 为常数; (3) Cov( X1 X2 ,Y ) Cov( X1,Y ) Cov( X2 ,Y ).
4. 协方差的计算
1). 利用定义计算
若 ( X ,Y ) 为离散型,
cov( X ,Y ) (xi E( X ))( y j E(Y ))pij
i1 j1
若 ( X ,Y ) 为连续型,
cov( X ,Y ) (x E(X ))( y E(Y )) f (x, y)dxdy
)2
1 2(1
ρ2
)
y μ2 σ2
ρ
x
μ1 σ1
2
令 t 1 y μ2 ρ x μ1 , u x μ1 ,
1 ρ2 σ2
σ1
σ1
Cov(X ,Y )
1

(σ1σ2
1
ρ2 tu
ρσ1σ
2u2
)e
u2 2
t2 2
dtdu
ρσ1σ2 2π
u2e
u2 2
d
2). 利用计算公式
(1) Cov(X ,Y ) E( XY ) E( X )E(Y );
(2) D( X Y ) D( X ) D(Y ) 2Cov( X ,Y ).
例1 已知 X ,Y 的联合分布为
pij X
1
0
Y
1
p
0
0
0
q
求 cov (X ,Y ), XY

X 10
Y 10
P pq
1 Cov( X , X ) 1 Cov( X ,Y )
3
2
1 3
D(
X
)
1 2
ρXY
D( X )
D(Y ) 3 3 0.
故 ρXZ Cov( X , Z) ( D( X ) D(Z)) 0.
二、相关系数的意义
1. 问题的提出
问 a,b 应如何选择 ,可使 a bX 最接近 Y ? 接近的程度又应如何来 衡量 ?

Cov(X ,Y ) ρXY D( X ) D(Y )
称为随机变量 X 与 Y 的相关系数.
3. 说明
(1) X 和 Y 的相关系数又称为标准协方差,它是一 个无量纲的量.
(2) 若随机变量 X 和 Y 相互独立 Cov(X ,Y ) E{[X E( X )][Y E(Y )]}
E[X E( X )]E[Y E(Y )] 0.
第三节 协方差及相关系数
一、协方差与相关系数的概念及性质 二、相关系数的意义 三、小结
一、协方差与相关系数的概念及性质
1. 问题的提出
若随机变量 X 和 Y 相互独立,那么
D( X Y ) D( X ) D(Y ). 若随机变量 X 和 Y 不相互独立
D( X Y ) ?
D( X Y ) E[( X Y ) E( X Y )]2
u
t2
e2
d
t
ρσ1σ2 2
σ1σ2
1 2π
ρ2
u2
ue 2
d
u
t2
te 2
d
t
2 2,
故有Cov( X ,Y ) ρσ1σ2 .
于是 XY
Cov( X ,Y ) .
D( X ) D(Y )
结论
( 1) 二维正态分布密度函数中,参数 ρ 代表了X 与Y 的相关系数;
相关主题