当前位置:文档之家› 应用多元统计分析-第九章 典型相关分析

应用多元统计分析-第九章 典型相关分析

• 例如:业内人士和观众对于一些电视节目的观点 有什么样的关系呢?数据tv.sav是不同的人群对 30个电视节目所作的平均评分。 • 观众评分来自低学历(led)、高学历(hed)和网络 (net)调查三种,它们形成第一组变量; • 而业内人士分评分来自包括演员和导演在内的艺 术家(arti)、发行(com)与业内各部门主管(man) 三种,形成第二组变量。人们对这样两组变量之 间的关系感到兴趣。
假设p q,令 cov(X (1),X (1) )= 11 , (X (2),X (2))= 22 cov cov X (1),X (2))= 12 '21 (
典型相关分析原理及方法
(1) X1 X (1) X (1) p X ( p q )1 ( 2) ( 2) X X1 ( 2) X q 11 12 cov(X, X) 21 22
典型相关系数的检验
• 整体检验:
H 0 : cr1 cr2 crd 0
典型相关系数的检验
• 维度递减检验:仍然是一种多元检验, 但可以提供每对典型变量的典型相关是 否显著的信息。
Dimension Reduction Analysis
Roots 1 to 3 2 to 3 3 to 3
低 学 历 高 学 历 第一组 变量: 观众
艺 术 家
典型相关
第二组 变量: 业内 人士
发 行 人
网 络
主 管
如何进行典型相关
• 如果直接对这六个变量的相关进行两两 分析,很难得到关于这两组变量之间关 系的一个清楚的印象。 • 希望能够把多个变量与多个变量之间的 相关化为两个变量之间的相关。 • 现在的问题是为每一组变量选取一个综 合变量作为代表; • 而一组变量最简单的综合形式就是该组 变量的线性组合。
典型相关模型的基本假设和数据要求
• 所有观测变量为定量数据。同时也可将 定性数据按照一定形式设为虚拟变量后, 再放入典型相关模型中进行分析。 • 检验假设:
H 0 : cr1 cr2 crd 0
典型相关分析说明
• 下面就tv.sav数据进行典型相关分析 的说明
•头两对典型变量(V, W)的累积特征根已经占了总 量的99.427%。它们的典型相关系数也都在0.95 之上。
相关分析的冗余分析
• 通过不同观察变量组的代表比例和解释 比例相乘,可以得到因变量组总方差与 协变量组总方差的共享比例。即: • 因变量组的Var DE×协变量组的Var DE • 或:因变量组的Var CO×协变量组的 Var CO 两个变量组的共享方差
相关分析的冗余分析
• • • • • • 第一典型相关的共享方差为: 0.41078×0.72349=0.29720=29.720% 第二典型相关的共享方差为: 0.43353×0.24575=0.10354=10.654% 第三典型相关的共享方差为: 0.04384×0.03076=0.00135=0.135%
CAN. VAR 1 2 3
Pct Var DE 71.691 22.310 1.249
Cum Pct DE 71.691 94.001 95.251
Pct Var CO 72.349 24.575 3.076
Cum Pct CO 72.349 96.924 100.00
相关分析的冗余分析
• 解释比例=代表比例×典型相关系数的平方 • 对于因变量则有: Var CO=Var DE×Sq.Cor 41.078=41.455×0.991 • 所以典型相关系数高时,并不说明典型变 量对观测组变量的解释程度高,代表程度 高。
典型系数
• 可以看出,头一个典型变量V1相应 于前面第一个(也是最重要的)特 征值,主要代表高学历变量hed; • 而相应于前面第二个(次要的)特 征值的第二个典型变量V2主要代表 低学历变量led和部分的网民变量 net,但高学历变量在这里起负面作 用。
典型系数
• 类似地,也可以得到被称为协变量(covariate) 的标准化的第二组变量的相应于头三个特征值 得三个典型变量W1、W2和W2的系数:
建立第二对典型变量(函数)的原则
• 继续在两组变量剩余的变化中寻找第二 个最大的共变部分,形成第二对典型变 量,并解出第二维度上的典型相关系数。 • 依此类推,直至所有变化部分被剥离完 毕。
典型相关分析原理及方法
• 设有两组随机向量,
X 代表第一组的p个变量,
(1)
X 代表第二组的q个变量,
(2)
典 型 相 关 分 析
第九章
典型相关分析
两组变量的相关问题
• 我们知道如何衡量两个变量之间是 否相关的问题;这是一个简单的公 式就可以解决的问题(Pearson相关 系数、 Kendall’s t、 Spearman 秩相关系数)。 • 如果我们有两组变量,如何表明它 们之间的关系呢?
例9.1(数据tv.sav)
典型相关分析原理及方法
• 显见:
D(U) D(a X (1) ) a cov( X (1) , X (1) )a a 11 a X (2) ) b cov( X (2) , X (2) )b b 22 b D(V ) D(b cov(U , V ) a cov( X (1) , X (2) )b a 12 b a 12 b cov(U , V ) corr (U , V ) D(U ) D(V ) a 11 a b 22 b
典型负载(相关)系数
• 也称为因变量或协变量与典型变量之间 的两两相关系数。
例子结论
• 从这两个表中可以看出,V1主要和变量hed相关,而 V2主要和led及net相关;W1主要和变量arti及man相 关,而W2主要和com相关;这和它们的典型系数是一 致的。 • 由于V1 和W1 最相关,这说明V1 所代表的高学历观众 和W1所主要代表的艺术家(arti)及各部门经理(man) 观点相关;而由于V2 和W2 也相关,这说明V2 所代表 的低学历(led)及以年轻人为主的网民(net)观众和 W2所主要代表的看重经济效益的发行人(com)观点相 关,但远远不如V1 和W1 的相关那么显著(根据特征 值的贡献率)。
x1
y1
X x2 cr1 V1 V2 | Vd cr2 crd
Y W1 W2 | Wd y2
xi (V1=a0+a1x1+…+aixi)
d=min(i, j)
yj (W1=b0+b1y1+…+bjyj)
建立第一对典型变量(函数)的原则
• 尽量使所建的两个典型变量之间的相关 系数最大化,就是在两个变量组各自的 总变化中先寻求他们之间最大的一部分 共变关系,并用一对典型变量所描述。 • 因而,第一维度上的典型相关系数也随 之求的。
典型相关分析原理及方法
• 根据典型相关分析的基本思想,要进行 两组随机向量间的相关分析,首先要计 算出各组变量的线性组合——典型变量, 并使其相关系数达到最大。因此,我们 设两组变量的线性组合分别为:
U aX
(1)
a1X a p X
(1) 1
(1) p
(2) X(1) b1X1 bq X(2) Vb q
Cum Pct DE 41.455 89.208 100.00
Pct Var CO 41.078 43.353 4.384
Cum Pct CO 41.078 84.431 88.814
相关分析的冗余分析
• 其中:DE——因变量组 CO——协变量组
Variance in covariates variables explained by canonical variables
注意
• 严格地说,一个典型相关系数描述的只 是一对典型变量之间的相关,而不是两 个变量组之间的相关。 • 而各对典型变量之间构成的多维典型相 关才共同揭示了两个观测变量组之间的 相关形式。
典型相关模型的基本假设和数据要求
• 要求两组变量之间为线性关系,即每对 典型变量之间为线性关系; • 每个典型变量与本组所有观测变量的关 系也是线性关系。如果不是线性关系, 可先线性化:如经济水平和收入水平与 其他一些社会发展水之间并不是线性关 系,可先取对数。 • 即log经济水平,log收入水平。
典型相关系数的平方
• 与简单相关系数一样,典型相关系数的实际意 义并不十分明确。 • 所以,由经验的研究人员往往更愿意采用典型 相关系数的平方(相当于回归分析中的确定系 数)。 • 由于相关涉及的两个典型变量都是标准化的, 所以双方的方差都等于1 。典型相关系数的平 方的实际意义是一对典型变量之间的共享方差 在两个典型变量各自方差中的比例。
典型系数
• 这些系数以两种方式给出;一种是没有 标准化的原始变量的线性组合的典型系 数(raw canonical coefficient),一种 是标准化之后的典型系数(standardized canonical coefficient) 。 标 准 化 的 典 型系数直观上对典型变量的构成给人以 更加清楚的印象。
Wilks L. F Hypoth 0.00050 141.58046 0.05471 40.94049 0.59382 17.78432
DF 9.00 4.00 1.00
Error DF Sig. of F
58.56 50.00 26.00
0.000 0.000 0.000
典型系数
• 下面表格给出的是第一组变量相应于上 面三个特征根的三个典型变量V1、V2和V3 的 系 数 , 即 典 型 系 数 (canonical coefficient)。 • 注 意 , SPSS 把 第 一 组 变 量 称 为 因 变 量 (dependent variables),而把第二组称为 协变量(covariates);显然,这两组变量 是完全对称的。这种命名仅仅是为了叙 述方便。
相关主题