当前位置:文档之家› 典型相关分析的实例ppt课件

典型相关分析的实例ppt课件


典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
.
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它 的应用。
.
实例(X与Y地位相同)
.
1985年中国28 省市城市男生 (19~22岁)的调查数据。记形态指标身
高(cm)、坐高、体重(kg)、胸围、肩 宽、盆骨宽分别为X1,X2,…,X6;
机能指标脉搏(次/分)、收缩压 (mmHg) 、舒张压(变音)、 舒张压(消 音)、肺活量(ml)分别为Y1,Y2,…, Y5。现欲研究这两组变量之间的相关 性。
2
c22
Y2
• 1与2是三个X变项的线性组合。 • η1与η2代表两个. Y变项的线性组合。
二、典型相关系数及其检验
.
(一)求解典型相关系数的步骤
1.
求X,Y变量组的相关阵
R= R11
R
21
R12
R
2
2

2. 求矩阵 A、B
3. A(R11)1R12(R22)1R21
B(R22)1R21(R11)1R12
.
5个λ与典型相关系数
1 1 0 .8 7 4 2 2 2 0 .7 3 7 3 3 3 0 .5 1 1 0 4 4 0 .3 5 4 4 5 5 0 .1 4 8 2
.
4. 求A、B关于λi的变量系数
(求解第1典型变量系数)
Aaa 如矩A阵 关于第一特 0.7征 64的 根 3 矩阵为:
0.5298 0.4586 0.3053 0.3986 0.29190.1778a21
a21
0.09120.07010.16690.19390.00070.0168a22
a22
0.2274
0.2739
0.5489
0.0840
0.5238 0.4468a230.5436a23
0.0966 0.0376 0.0510 0.3877 0.25230.1759a24
.
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
Ui ai1X1*ai2X2*L ai,pX*p aX* Vi bi1Y1*bi2Y2*L bi,qYq* bY*
i 1,2,L m,min(p,q)m 典型相关系数 i Corr(Ui,Vi) 典型变量系数或典型权重 a、b
典型相关分析
Canonical Correlation Analysis
.
一、引言
.
(一)何时采用典型相关分析
1. 两个随机变量Y与X
简单相关系数
2. 一个随机变量Y与一组随机变量X1,X2,…,
Xp
多重相关(复相关系数)
3. 一组随机变量Y1,Y2,…,Yq与另一组随
机变量X1,X2,…,Xp 典型(则)相关系数
(2)
典型相关系数, i j
Corr(Ui
,Vj
)
0,
i j
【除前面(i 1)个CanR之外的最大者】
3 Ui、Vi的均数为0,方差为1。
.
(三)典型相关分析示意图
X1 b11 b21
b12 X2 b22
b13
X3
b23
典型典加型权相系典关数型系变数量
1
ρ11
1
c11
Y1
c21
c12
2
ρ22
4. 可以证明A、B有相同的非零特征根;
.
3. 求A或B的λi(相关系数的平方)与 i ,
i=1,…,m,即 i i2 ;
4. 求A、B关于λi的特征根向量即变量加权系
数。
.
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵 R=
R11
R
21
R12
R
22
.
Corr(X)=R11 Corr(X,Y)=R12
a14
0.09150.09790.06690.037700.0061 0.0806a15
a15
0.0948 0.1421 0.1757 0.0210 0.2171 0.3142a16
a16
此外,还应 U1满 (a足 1 1X1* a1 6X6*)的方1差 。为

求解第2典型变量系数
Aaa 如矩A阵 关于第一特 0.5征 43的 根 6 矩阵为:
.
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1, X2,…,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为:
1 =Corr(U1,V1)(使U1与V1 间最大相关)
第二对典型相关变量间的典型相关系数为:
2 =Corr(U2,V2)(与U1、V1 无关; 使U2与V2
.
.
简单相关系数矩阵
.
简单相关系数公式符号
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
R21 R12
.
Corr(Y)=R22
简单相关系数 描述两组变量的相关关系的缺点
➢只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。
➢两组间有许多简单相关系数(实例为30 个),使问题显得复杂,难以从整体描 述。
Corr(Y,X)=R21
.
Corr(Y)=R22
2. 求矩阵A、B
A(R11)1R12(R22)1R21 B(R22)1R21(R11)1R12
.
A矩阵(p×p)
.
B矩阵(q×q)
.
3. 求矩阵A、B的λ(相关系数 的平方)
AIBI0
A、B有相同的非零特征值
.
B矩阵求λ (典型相关系数的平方)
0.5298 0.4586 0.3053 0.3986 0.29190.1778a11
a11
0.09120.07010.1669 0.1939 0.00070.0168a1 2
a12
0.2274
0.2739
0.5489
0.0840
0.5238 0.4468a130.7643a13
0.0966 0.0376 0.0510 0.3877 0.25230.1759a14
间最大相关)
..... ……
第五对典型相关变量间的典型相关系数为:
5 =Corr(U5,V5) (与U1、V1 、…、 U4、V4
无关; U5与V5 间最大相关)
有:
12L50
.
典型相关变量的性质
1, i j
1, i j
(1) Corr(Ui,Uj ) 0, i j Corr(Vi,Vj ) 0, i j
相关主题