当前位置:文档之家› 第六章相关系数检验

第六章相关系数检验

第六章 相关系数检验
一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。

这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。

因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。

现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。

6·1、建立相关系数检验方法的基本思路
实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。

其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。

下面简要介绍其方法的建立过程:
首先,我们有
Y 的总的变化可表示为 : Y Y y i i -=
回归直线能够解释的部分: Y Y y i
i -=ˆˆ 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ˆ-= 因而我们有
Y 的总的变差=∑∑∑++=+=)ˆ2ˆ()ˆ(2
2
22
i i i i i i i e e y y e y
y 其中,)(ˆ)ˆ(ˆ)ˆ)(ˆ(ˆ2
22∑∑∑∑∑∑∑-
=-=-=i
i
i i i i i i i i i i i i x
x y x y x x y x x y x e y βββββ
=0
(注意:i i i i x X Y Y y X Y X Y ββαβαβαβαˆˆˆˆˆˆˆ,ˆˆ,ˆˆ=---=-=∴+=∴-= ,另外 i i i i i i i x y y y Y Y e βˆˆˆ-=-=-=)。

所以,我们最终有
Y 的总的变差==∑∑∑∑+=++=+=)ˆ()ˆ2ˆ()ˆ(2
2
2
2
22
i i i i i i i i i e y e e y y e y
y 亦即,
Y 的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分
显然这个结论是十分重要的,在计量经济学中已有许多类似的结果。

没有这样的结果,我们的方法就建立不起来,也没有什么意义了。

我们也应进一步思考,为什么会有这样好的结果呢?这实际上正是线性方法或线性思想的特征或优势所在。

6·2、相关系数的计算和特征
根据建立相关系数的基本思路,我们用2R 表示相关系数,则有
2R =已由解释变量说明的部分÷Y
的总的变差
=∑∑∑∑∑∑-
=--=
222
2221)
()ˆ(ˆi
i
i
i i
i y
e Y Y Y Y y
y
由此可知:
当i i Y Y =ˆ时,2R 达到最大值,即2R =1; 当Y Y i =ˆ时,2R 达到最小值,即2R =0; 所以 102≤≤R 。

2R 还能够写成其它形式,如
i
i x y βˆˆ= ,代入 ∑∑
∑∑=
i
i i
i
y
x y
y 2
222ˆˆβ ,而∑∑=i
i
i x
y
x 2ˆβ
,再代入则有
∑∑∑∑∑∑∑∑∑
∑∑=

=
=
=
)
)(()()()(ˆˆ2
2
2222
2222222
i i i i i
i i i i i
i i
i x y y x y
x x y x y x y
y R β
还可以写成另一个形式
R=
∑∑∑)
)((22i
i
i
i x
y y x , 这时11≤≤-R ,R=-1时,称之为完全负相关,而
R=1时,称之为完全正相关。

除了相关系数外,还有其他相关系数,如偏相关系数和复相关系数,它们都是涉及到多元回归问题的。

其中,所谓偏相关系数是指度量在其他所有变量保持不变的条件下,任意两个变量之间的相关程度的系数。

而复相关系数是指多个变量的相关系数中,例如 Y ,k X X X ,,,21 ,对于其中的变量Y 的复相关系数是指除Y 以外的其它变量k X X X ,,,21 对Y 的相关程度的度量(具体内容这里略去)。

6·3、相关系数的应用
相关系数的意义主要是在概率意义上反映了解释变量与被解释变量之间的线性相关程度,亦即检验假设
)(i Y E =i X βα+ 或 )(i E μ=0
相关系数最大的不足是不能给出变量之间的因果关系,亦即不能揭示变量之间相互依赖的确切关系。

正因为如此,相关系数高的原因是多种多样: (1) Y 和X 分别互为变化的原因; (2) Y 和X 同时互为变化的原因;
(3) 量Y 和X 的变化是由另一个变量W 引起的,而它们之间实际上并无直接
的因果关系; (4) 变量X 、Y 之间的相关可能纯粹是偶然的巧合,实际上并无任何因果关系。

因此,仅仅知道相关系数的结果是不够的,相关系数或相关分析不能给出X 和Y 之间是如何关联的。

实际上,变量之间的因果关系的确定只能依赖于经济理论或主观的经济分析。

另外,在实际应用中,人们往往采用相关系数来判断变量之间的相关程度。

值得指出地是,相关系数只是说明变量之间相关程度的充分条件,而不是必要条件。

例如,相关系数高的确能说明变量之间的相关程度、或线性相关程度高;但如果相关系数低,则不能说明变量之间的相关程度底,而只能说变量之间的线性相关程度底,完全不能够排除变量之间存在重要的非线性相关关系。

一般来说,相关系数低,或回归模型吻合度不好的主要原因有: (1) 模型中各变量之间本来就不存在因果关系; (2) 模型中漏掉了其它重要的变量;
(3) 变量之间关系的数学形式不正确(或成非线性关系)。

在上述原因中,尤其以第三种原因最为重要和突出,其解决的主要方式是回归模型的建立应以经济理论模型为依据,或建立模型前重视理论模型的分析。

第六章
作业
1、简述建立相关系数方法的基本思路,并指出相关系数检验存在的问题。

相关主题