当前位置:文档之家› 相关系数与协方差的关系

相关系数与协方差的关系


现得越来越强烈。就有 lim Cov(X,Y)= ,X 与 Y 间是完全负相关的。 n
又由于 Corr( X ,Y ) =-1,表明 X 与 Y 间是完全负相关的。其实,这个结论早就蕴含在
线性关系式 X+Y=n 之中了。 综上,就说明:在某种情况下,协方差和相关系数在反映 X 与 Y 间的关联程度时保持
一致性。若是这样的话,研究相关系数似乎有点多余了。因为,我们已经有一个可以反映 X 与 Y 间的关联程度的量了(即协方差),那我们能否找出相关系数更优秀的地方呢? 3 协方差与相关系数的“矛盾性”
Corr(X ,Y ) 越接近 1,则线性相关程度越高; Corr(X ,Y ) 越接近 0,则线性相关程度
·当 Cov(X,Y)=0 时,称 X 与 Y 不相关。 也就是说,协方差就是用来描述二维随机变量 X 与 Y 相互关联程度的一个特征数。协 方差 Cov(X,Y)是有量纲的量,譬如 X 表示人的身高,单位是米(m),Y 表示人的体重,单 位是公斤(kg),则 Cov(X,Y)带有量纲(m·kg)。为了消除量纲的影响,对协方差除以相同 量纲的量,就得到一个新的概念—相关系数,它的定义如下:
设(X ,Y)是一个二维随机变量,且Var( X ) >0,Var(Y ) >0.则称
Cov( X ,Y )
Cov( X ,Y )
Corr( X ,Y ) =
=
Var( X ) Var(Y ) x y
为 X 与 Y 的(线性)相关系数。
利用施瓦茨不等式我们不难得到-1 Corr( X ,Y ) 1.也就是说相关系数是介于-1 到 1
当程度的正相关;但从相应的协方差 Cov( X ,Y ) =0.0471 看,X 与 Y 的相关性很微弱,几
乎可以忽略不计。造成这种错觉的原因在于没有考虑标准差,若两个标准差都很小,即使协 方差小一些,相关系数也能显示一定程度的相关性。由此可见,在协方差的基础上加工形成 的相关系数是更为重要的相关性的特征数。
=3
由此得
Corr(U ,V ) =
Cov(U ,V )
3 3
==
Var(U ) Var(V ) 5 5
服从参数为 的泊松分布中得 >0,由协方差 Cov(U,V)=3 是恒大于 0 的,再由相关
系数 Corr(U ,V ) = 3 ,就很好的说明协方差与相关系数均可以反映二维随机变量关联程度。 5
我们再看下一个例题,看能否能出这个结论呢?
例二 将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和反面向上的次数,试求 X
和 Y 的协方差和相关系数。
解:因为 X+Y=n,且 X~b(n,1/2),Y~b(n,1/2),所以
Var (X) =Var (Y)= n , 4
Cov(X,Y)=Cov(X ,n-X)=-Cov(X,X)=- n 4
例一 设随机变量 X 和 Y 独立同服从参数为 的泊松分布,令
U=2X+Y,
V=2X-Y。
求 U 和 V 的协方差及相关系数。
解:因为
Var(U ) =Var (2X+Y)=5 ,Var (V)=Var (2X-Y)=5 .
所以
Cov(U,V)=Cov(2X+Y,2X-Y) =Cov(2X,2X)+Cov(Y,2X)-Cov(2X,Y)-Cov(Y,Y)
负相关。
·若 0< Corr(X ,Y ) <1,则称 X 与有“一定程度”的线性关系。
2 协方差与相关系数的一致性
从协方差与相关系数的定义和性质我们不难发现,协方差与相关系数都是反映 X 与 Y
相关程度的量。也就是说,他们有异曲同工之效。在刻画二维随机变量两个分量间相互关联
程度时,他们保持了一致性。这一点我可以给出以下两个例子来说明。
广泛应用。本文的目的在于从协方差与相关系数的关系的角度去探讨协方差与相关系数的优 缺点,并具体介绍协方差和相关系数这两个描述二维随机变量间相关性的特征数。
关键字:协方差 Cov( X ,Y ) 相关系数 Corr( X ,Y ) 相互关联程度
1 协方差、相关系数的定义及性质
设(X ,Y)是一个二维随机变量,若 E{ [ X-E(X) ] [ Y-E(Y) ] }存在,则称此数学期望
参考文献
[1] 茆诗松,程依明,濮晓龙.概率论与数理统计教程.北京:高等教育出版社,2004
[2] 董永权,王占民.关于相关系数 的几点注释.唐山 063000
[3] 谢明文,关于协方差、相关系数与相关性的关系.四川成都 610074
Corr( X ,Y ) =
Cov( X ,Y ) = n 4 =-1
Var( X ) Var(Y )
n 4
我们假定 n=1,Cov(X,Y)= 1 ;n=100,Cov(X,Y)=-25;n=10000,Cov(X,Y)=-2500…… 4
我们可以得出,随着 n 的增大,协方差 Cov(X,Y)就越来越小,随之 X 与 Y 的负相关性就表
Var(X ) 、Var(Y ) 及 E( XY) 。
最后得协方差和相关系数为
Cov(X ,Y ) = E(XY) - E(X ) E(Y ) =0.0471
Cov( X ,Y )
Corr( X ,Y ) =
=0.8243
x y
这个协方差很小,但其相关系数并不小。从相关系数 Corr( X ,Y ) =0.8243 看,X 与 Y 有相
之间的,并且可以对它作以下几点说明:
·若 Corr( X ,Y ) =0,则称 X 与 Y 不相关。不相关是指 X 与 Y 没有线性关系,但也有
可能有其他关系) =1,则称 X 与 Y 完全正相关;若 Corr( X ,Y ) =-1,则称 X 与 Y 完全,
为 X 与 Y 的协方差,并记为 Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] },特别有 Cov(X,X)=Var( X ) 。
从协方差的定义可以看出,它是 X 的偏差“X-E(X) ”与 Y 的偏差“Y-E(Y)”的乘积的 数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下:
·当 Cov(X,Y)>0 时,称 X 与 Y 正相关,这时两个偏差 [ X-E(X) ] 与[ Y-E(Y) ] 同时增 加或同时减少,由于 E(X)与 E(Y)都是常数,故等价于 X 与 Y 同时增加或同时减少,这就是 正相关的含义。
·当 Cov(X,Y)<0 时,称 X 与 Y 负相关,这时 X 增加而 Y 减少,或 Y 增加而 X 减少, 这就是负相关的含义。
越低。而协方差看不出这一点。若协方差很小,而其两个标准差 X 和 Y 也很小,则其比
值就不一定小,下面我们来看实例。 例三 已知随机向量(X,Y)的联合密度函数为
p(x, y)
8,0 x y0.5,0 x, y1; 3 0, 其他
求 X,Y 的协方差及相关系数。
解:先计算两个边际密度函数,再分别计算 E( X ) 、 E( X 2 ) 、 E(Y ) 、 E(Y 2 ) 、
探究协方差与相关系数
罗燕
摘要:协方差 Cov( X ,Y ) 是描述二维随机变量两个分量间相互关联程度的一个特征数,如
果 将 协 方 差 相 应 标 准 化 变 量 就 得 到 相 关 系 数 Corr( X ,Y ) 。 从 而 可 以 引 进 相 关 系 数
Corr( X ,Y ) 去刻画二维随机变量两个分量间相互关联程度。且事实表明,相关系数明显被
相关主题