当前位置:文档之家› 典型相关分析模型

典型相关分析模型


如果
p
q





X Y






XX YX
XY YY
已知

aCovX ,Y b a XY b
aDX a a XX a
bDY b b YY b
(10.14) (10.15) (10.16)
两 综 合 性 指 标 aX 与 bY 的 构 造 就 转 化 为 求 解 约 束 优 化 问 题
它 们 间 具 有 最 强 的 线 性 相 关 性 , 其 相 关 系 数1 称 第 一 典 型 相 关 系 数 ; 称 a 2 X , b2Y 是 X ,Y 的 第 二 对 典 型 相 关 变 量 , 它 们 间 的 线 性 相 关 性 仅 次
于 第 一 对 典 型 相 关 变 量 , 其 相 关 系 数 2 称 第 二 典 型 相 关 系 数 ; 等 等 。
s
min a ,b
.t. a
a XX
XY
a
b
1
b YY b 1
(10.17)
经过一系列的理论推导,
可 以 匹 配 出 r 对 综 合 性 指 标 aiX 和biY ,i 1,2 , , r , 根 据 它 们 间 相 关 系 数 的 大 小 , 依 次 称 a1 X ,b1Y 是X ,Y 的 第 一 对 典 型 相 关 变 量 ,
在经济学中研究几种主要肉食品的价格与销售量之间的相关性; 在气象学中研究相继两天气象因子间的相关性; 在卫生防疫中研究某些疾病与生活习惯之间的相关性,等等。
典 型相关分 析方法 采用主成 分分析 的做法, 在每一 组变量 中都 适 当 构 造 若 干 个 有 代 表 性 的 综 合 性 指 标( 变 量 的 线 性 组 合 ), 通 过 考 察 这 些 综 合 性 指 标间的相关性来揭示两组原始变量间的相关关系。














A
1 XX
XY
1 YY
YX

B
1 YY
YX
1 XX
XY






2 1
2 2
2 r0Biblioteka A,再 求 矩 阵

B
与 各 特 征 根 相 配 对 的 分 别 满 足 条 件 ai XX ai 1 , bi YY bi 1 的 特 征
向 量 ai , bi i 1,2, , r 。
0.149 0.177 0.705 0.759
0.037 0.002 00.0.00097
求得矩阵 A 的特征根:21 0.915,22 0.339 ,23 0.032 ,24 0.000
相应得典型相关系数: 1 0.957,2 0.582 ,3 0.182 ,4 0
130
85
26
131
25
82.9
72
135
80
28
128
35
88.1
75
140
90
29
126
40
88.4
78
140
92
27
126
45
80.6
73
138
85
32
118
20
88.4
70
130
80
31
120
18
87.8
68
135
75
34
124
25
84.6
70
135
75
36
128
25
88.0
75
140
80
38

a X , bY
Cov a X D a X
, bY D bY
a Cov X ,Y b a D X a bD Y b
可 知 , 若 不 对 向 量 a , b 加 以 适 当 限 制 , 使 相 关 系 数a X , b Y 达
到最大的 a,b 将不唯一。
这是 因为,随 机变量乘 以常数后 不改变相 互间的相 关系数。
较 为 合 理 的 限 制 是 a D X a 1 且 b D Y b 1 。
于 是 构 造 具 有 最 大 相 关 系 数 的 两 个 综 合 性 指 标a X 与b Y 的
a D X a 1 b D Y b 1
问题就转化为在约束条件

之下求
a , b , 使 a Cov X , Y b 达 到 最 大 。
b Y b1Y1 b 2Y 2 bqY q 可 看 作 是 第 二 组 随 机 变 量
Y1 , Y 2 , , Y q 的 某 项 综 合 性 指 标 , 规 则 是 希 望 通 过 适 当 选 择 向 量 a X b Y a,b , 使 综 合 性 指 标 与 有 最 大 相 关 系 数 。
124
23
85.6
72
145
86
41
135
40
86.3
76
148
88
46
143
45
84.8
80
145
90
47
141
48
87.9
82
148
92
48
139
50
81.6
85
150
95
45
140
55
88.0
88
160
95
0.415
A
1 XX
XY
1 YY
YX
=
0.132 00..139993
0.233 0.157 0.334 0.455
典型相关分析
典型相关分析是研究两组随机变量
X X 1 , X 2 , , X p 与 Y Y1 ,Y2 , ,Yq 之 间 的 相 关 关 系 ,
探讨它们之间相关关系的表达方式与强弱的度量。 在实际问题中,经常遇到要研究一部分变量与另一部 分变量之间的相关关系,
例如:
在工厂里, 考察原料的若干项质量指标 X 1 , X 2 , , X p 与 产品的若干项主要 质 量 指 标 Y1 , Y2 , , Yq 之 间 的 相 关 性 ;
之间的相关关系。
由于总体的协差阵未知,为了进行样本典型相关分析 ,随机抽取了容量为 15 的样本,
测得观测值如表 10.1 所示。
表 10.1
年龄
体重 日吸烟量 胸围
脉搏
收缩压 舒张压
( 岁 ) ( 斤 ) ( 支 ) ( 厘 米) (次/分) (mm Hg) (mm Hg)
25
125
30
83.5
70
设 a a 1 , a 2 , , a p , b b1 , b 2 , , b q 是 两 个 按 某 种 规 则
确定的常值向量,
则 a X a1 X 1 a 2 X 2 a p X p 可 看 作 是 第 一 组 随 机 变 量
X 1 , X 2 , , X p 的 某 项 综 合 性 指 标 ,
例 :考 查 吸 烟 者 的 年 龄 体 形( 指 标 为 :X 1 — — 年 龄 ; X 2 — — 体 重 ;X 3 — — 日 吸 烟 量 ;
X 4 — — 胸 围 ) 与 基 本 健 康 状 况 ( 指 标 为 :Y1 — — 脉 搏 ;Y2 — — 收 缩 压Y;3 — — 舒 张 压 )
相关主题