当前位置:文档之家› 第六章-典型相关分析

第六章-典型相关分析


所以,两边同时求行列式,有
I
1 S yx S xx
0 S xx I S yx
1 S xy I S S xx xx S xy S yy 0 S yx I
S xy S yy
| S |
S xx S yx
S xy S yy
1 S yy S xx S xy S yy S yx
性显著。
第四节 典型相关分析的计算步骤
在实际应用中,总体的协方差矩阵常常是未知的, 类似于其他的统计分析方法,需要从总体中抽出一 个样本,根据样本对总体的协方差或相关系数矩阵
进行估计,然后利用估计得到的协方差或相关系数
矩阵进行分析。由于估计中抽样误差的存在,所以
估计以后还需要进行有关的假设检验。
1、假设有X组和Y组变量,样本容量为n。假设( X1, Y1), ( X2, Y2),…, ( Xn, Yn),观测值矩阵为:
y1q yq y2 q yq y3q yq y4 q yq ynq yq
S xx 1 1 ˆ 样本的协方差: ZZ n 1 n 1 S yx
S xy S yy
2、计算特征根和特征向量
1 1 ˆ 1 ( S xx 令:M S xy S yy S yx ) 1 1 ˆ 2 ( S yy 令:M S yx S xx S xy )
2 2 求M1和 M2的特征根 1 ,对应的特征向 2 2 r
量 i和i (i 1,2,, r 。则特征向量构成典型变量方。
第五节 邮电业与国民经济的典型相关分析

二、数据分析 我们将基于1995年到2007年我国国民经济数据(数据来 自于中国统计年鉴),利用Stata软件来做邮电业和国民经 济之间的典型相关分析。数据具体见表1.
1小,支持H1。
在原假设为真的情况下,检验的统计量
1 Q1 n ( p q 3) ln 1 2
近似服从自由度为 pq 的 2 分布。在给定 的显著性水平 下,如果22 (pq),则拒绝 原假设,认为至少第一对典型变量之间的相 关性显著。
依此类推,再检验下一对典型变量之
事实上
S xx S S yx I 1 S S yx xx S xx 0 S xy S yy 0 S xx S I yx 0
1 S xy I S xx S xy S yy 0 I
1 S yy S yx S S xx xy
x11 x 21 x31 Z x41 xn1 x1 p x2 p x2 p x4 p xnp y11 y21 y31 y41 yn1 y1q y2 q y3q y4 q ynq
间的相关性。直至相关性不显著为止。对两
组变量x和y进行典型相关分析,采用的也是
一种降维技术。我们希望使用尽可能少的典
型变量对数,为此需要对一些较小的典型相
关系数是否为零进行假设检验。H0经检验被
拒绝,则应进一步检验假设。
(二)部分总体典型相关系数为零的检验
H 0:2 = 3 = r
H1 : 2 , 3 ,, r 至少有一非零
相关分析。用样本来估计总体的典型相关系数是否有误,需 要进行检验。
(一)整体检验 ( H 0 : xy 0; H1 : xy 0)
H 0 : 1 r 0
H1 : i (i 1,2,, r )中至少1不为零
检验的统计量: 0
|S| | S xx || S yy |
二、典型相关分析的基本思想
三、典型相关分析的数学描述
四、典型相关分析的应用



典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变 量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析。 例如,为了研究扩张性财政政策实施以后对宏观经济发展的影响,就 需要考察有关财政政策的一系列指标如财政支出总额的增长率、财政 赤字增长率、国债发行额的增长率、税率降低率等与经济发展的一系 列指标,如国内生产总值增长率、就业增长率、物价上涨率等两组变量 之间的相关程度。 又如,为了研究宏观经济走势与股票市场走势之间的关系,就需要考 察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长 率等与各种反映股票市场状况的指标如股票价格指数、股票市场融资 金额等两组变量之间的相关关系。 再如,工厂要考察所使用的原料的质量对所生产的产品的质量的影响, 就需要对所生产产品的各种质量指标与所使用的原料的各种质量指标 之间的相关关系进行测度。
检验的统计量 k 1
i k 1
2 (1 i )
r
k 1 Q [n k ( p q 3) i2 ]ln k 1 2 i k 1
近似服从自由度为(p-k)(q-k)的2分布。在给 定的显著性水平下,如果22 [(p-k)(q-k)],则 拒绝原假设,认为至少第k+1对典型变量之间的相关
4 -0.0629 0.0000 -0.0003 0.0004
Raw coefficients for the second variable set 1 y1 y2 y3 y4 0.0001 -0.0000 0.0001 0.0000 2 -0.0001 0.0002 0.0013 -0.0003 3 -0.0005 0.0015 -0.0103 -0.0001 4 0.0016 0.0006 -0.0075 -0.0000
我们将采用如下指标来衡量
我国各年份的邮电业:
采用下面的指标来衡量 我国各年份的经济(单位都是万亿)

. canon (x1-x4) (y1-y4)
Number of obs = 13 1 x1 x2 x3 x4 -0.0069 0.0000 0.0000 0.0000 2 -0.0457 -0.0000 0.0003 -0.0004 3 -0.0038 -0.0001 0.0003 -0.0004 4 -0.0629 0.0000 -0.0003 0.0004
第六章 典型相关分析
第六章 典型相关分析
第一节 第二节 第三节 第四节 第五节

典型相关分析的基本原理 典型变量与典型相关系数的求法 典型相关系数的检验 典型相关分析的计算步骤 典型相关分析的SPSS实现
第一节 典型相关分析的基本原理
一、什么是典型相关分析 在对经济问题的研究和管理研究中,不仅 经常需要考察两个变量之间的相关程度, 而且还经常需要考察多个变量与多个变量 之间即两组变量之间的相关性。典型相关 分析就是测度两组变量之间相关程度的一 种多元统计方法。
所以若M的特征根为 ,则(l-M)的特征根
为(1-)。根据矩阵行列式与特征根的关系,
可得:
|S| 1 1 ˆ 1 I S xx S xy S yy S yx I M | S xx || S yy |
2 2 (1 12 )(1 2 )(1 p ) (1 i ) i 1 p
Canonical correlation analysis Raw coefficients for the first variable set
Raw coefficients for the second variable set 1 y1 y2 y3 y4 0.0001 -0.0000 0.0001 0.0000 2 -0.0001 0.0002 0.0013 -0.0003 3 -0.0005 0.0015 -0.0103 -0.0001 4 0.0016 0.0006 -0.0075 -0.0000


通常情况下,为了研究两组变量
( x1 , x2 ,, x p ) ( y1 , y2 ,, yq )

的相关关系,可以用最原始的方法,分别计 算两组变量之间的全部相关系数,一共有pq 个简单相关系数,这样又烦琐又不能抓住问 题的本质。如果能够采用类似于主成分的思 想,分别找出两组变量的各自的某个线性组 合,讨论线性组合之间的相关关系,则更简 捷。
e = exact, a = approximate, u = upper bound on F

. canon (x1-x4) (y1-y4), test(1 2 3 4)
Number of obs = 13
Canonical correlation analysis Raw coefficients for the first variable set 1 x1 x2 x3 x4 -0.0069 0.0000 0.0000 0.0000 2 -0.0457 -0.0000 0.0003 -0.0004 3 -0.0038 -0.0001 0.0003 -0.0004
x11 x1 x x 21 1 x31 x1 Z x x 41 1 xn1 x1
x1 p x p x2 p x p x2 p x p x4 p x p xnp x p
y11 y1 y21 y1 y31 y1 y41 y1 yn1 y1
Canonical correlations: 0.9984 0.9512 0.4436
0.3557
Tests of significance of all canonical correlations Wilks' lambda Pillai's trace Lawley-Hotelling trace Roy's largest root Statistic .000216101 2.22478 318.081 308.19 df1 16 16 16 4 df2 15.9129 32 14 8 F 14.7596 2.5065 69.5802 616.3803 Prob>F 0.0000 0.0131 0.0000 0.0000 a a a u
相关主题