第九章 典型相关分析9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
用于揭示两组变量之间的内在联系。
典型相关分析的目的是识别并量化两组变量之间的联系。
将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。
基本思想:(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
即: 若设(1)(1)(1)(1)12(,,,)p X X X =X、(2)(2)(2)(2)12(,,,)q X X X =X 是两组相互关联的随机变量,分别在两组变量中选取若干有代表性的综合变量Ui 、Vi ,使是原变量的线性组合。
在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大。
(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。
(3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
9.2 什么是典型变量?它具有哪些性质?答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。
具体来说,()(1)()(1)()(1)()(1)1122i i i i i P PU a X a X a X '=+++a X()(2)()(2)()(2)()(2)1122i i i i i q qV b X b X b X '=+++b X在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大,则称(1)(1)'a X 、(1)(2)'b X 是(1)X 、(2)X 的第一对典型相关变量。
典型变量性质:典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。
1. ()1,()1(1,2,,)k k D U D V k r ===(,)0,(,)0()i j i j Cov U U Cov V V i j ==≠2. 0(,1,2,,)(,)0()0()i i j i j i r Cov U V i j j r λ≠==⎧⎪=≠⎨⎪>⎩9.3 试分析一组变量的典型变量与其主成分的联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。
主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
()(1)()(1)()(1)()(1)1122i i i i i P P U a X a X a X '=+++a X ()(2)()(2)()(2)()(2)1122i i i i iq q V b X b X b X '=+++b X (1)(1)(1)(1)12(,,,)pX X X =X 、(2)(2)(2)(2)12(,,,)qX X X =X9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的p 对典型变量。
分析原始变量与典型变量之间相关性。
内容:令 (1)(2)*()p ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦a a A a (1)(2)*()p ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦b b B b 12p U U U ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦U 12p V V V ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦V *(1)*(2)==U A X V B X其中*A ,*B 为p 对典型变量系数向量组成的矩阵,U 和V 为p 对典型变量组成的向量。
则(1)*(1)(1)*11(,)(,)Cov Cov ==U X A X X A Σ(1)(1)(1)1/2(1)(,)(,)i ki kk k Corr U X Cov U X σ-===这里()1i D U =,1/2kk σ=。
记1/211V -为对角元素是1/2kk σ-的对角阵,所以有(1)(1)1/2(1)11,*(1)1/2(1)*1/2111111(,)(,)(,)U X Corr Cov Cov ---====R U X U V X A X V X A ΣV类似可得:(2)*1/22222,V X -=R B ΣV (2)*1/21222,U X -=R A ΣV (1)*1/22111,V X -=R B ΣV 对于经过标准化处理后得到的典型变量有:(1)*11,Z U Z =R A R ; (2)*22,Z V Z =R B R (2)*12,Z U Z =R A R ;(1)*21,Z V Z =R B R对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。
答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为11()tr p =R ,第二组变量样本的总方差为22()tr q =R 。
*ˆz A 和*ˆzB 是样本典型相关系数矩阵,典型系数向量是矩阵的行向量,*(1)ˆˆz =U A Z ,*(2)ˆˆz=VB Z 。
前r 对典型变量对样本总方差的贡献为(1)(1)(1)(2)(2)()()2ˆ,11ˆˆˆˆˆˆ()ik pr r r z zz zz zz U i k tr r =='''+++=∑∑aa a a aa (2)(1)(1)(2)(2)()()2ˆ,11ˆˆˆˆˆˆ()iKq rr r z z z zz z z Vi k tr r =='''+++=∑∑b b b b b b 则第一组样本方差由前r 个典型变量解释的比例为(1)(1)2ˆ,11ˆ|ik pr z U i k z U rd p===∑∑R第二组样本方差由前r 个典型变量解释的比例为(2)(2)2ˆ,11ˆ|ik qrz V i k z V rd q===∑∑R9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变量分别为()i a X '、()i b Y ',典型相关系数为i λ,(1,,)i p =。
令*X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ⨯⨯阶非奇异阵,l 、m 分别为p 维、q 维随机向量,试证明⑴ **X Y 、的第i 对典型变量为1()*i C a X -'、1()*i D b Y -'。
⑵ 1()*i C a X -'与1()*i D b Y -'的典型相关系数为i λ。
9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为10.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。
解:根据已知可得R ̂11=(10.030.031) R ̂12=(0.240.590.060.07)=R ̂′21 R ̂22=(10.240.241) R ̂−111=1(0.03−1−10.03)R̂−122=11−0.0576(0.03−1−10.03)M̂∗1z =R ̂−111R ̂12R ̂−122R ̂21= (0.50524550.072798410.08755550.01334270) M̂∗2z =R ̂−122R ̂21R ̂−111R ̂12=(0.10348010.24712470.17233400.4151081) 计算得M ̂∗1z ,M ̂∗2z 的特征值为λ12= 0.517878705 λ22=0.000709502提取第一典型变量为U 1∗=0.9852743Z 1(1)+0.1709812Z 2(1)V 1∗=−0.5121859Z 1(2)−0.8588746Z 2(2)其中Z i(1),Z j(2)分别为原始变量X i ,Y j 标准化后的结果。
按照常识,不应该有负数系数啊?不知道怎么回事。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成试对闭卷(1X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。
9.9 邓讷姆(Dunham )在研究职业满意度与职业特性的相关程度时,对从一大型零售公司各分公司挑出的784位行政人员测量了5个职业特性变量:用户反馈、任务重要性、任务多样性、任务特性及自主性,7个职业满意度变量:主管满意度、事业前景满意度、财政满意度、工作强度满意度、公司地位满意度、工种满意度及总体满意度。
两组变量的样本相关矩阵为:111.000.49 1.00ˆ0.530.57 1.000.490.460.48 1.000.510.530.570.57 1.00R ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦22 1.000.43 1.000.270.33 1.00ˆ0.240.260.25 1.000.340.540.460.28 1.000.370.320.290.300.35 1.000.400.580.450.270.590.31 1.00R ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦12210.330.320.200.190.300.370.210.300.210.160.080.270.350.20ˆˆ0.310.230.140.070.240.370.180.240.220.120.190.210.290.160.380.320.170.230.320.360.27R R ⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦试对职业满意度与职业特性进行典型相关分析。
9.10 试对一实际问题进行典型相关分析。