应用多元统计分析之典型相关分析(doc 6页)
联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。
主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
9.4 简述典型相关分析中载荷分析的内容及作用。
答:作用:进行典型载荷分析有助于更好解释分析已提取的p 对典型变量。
分析原始变量与典型变量之间相关性。
内容: 令
(1)(2)*
()p ⎡⎤⎢⎥⎢
⎥=⎢⎥⎢⎥⎣⎦
a a A a (1)(2)*
()p ⎡⎤⎢⎥⎢
⎥=⎢⎥⎢⎥⎣⎦
b b B b 12
p U U U ⎡⎤⎢⎥⎢⎥
=⎢⎥⎢⎥⎢⎥⎣⎦
U 12
p V V V ⎡⎤
⎢⎥⎢⎥
=⎢⎥⎢⎥⎢⎥⎣⎦
V
*(1)
*(2)
==U A X V B X
其中*
A ,*
B 为p 对典型变量系数向量组成的矩
阵,U 和V 为p 对典型变量组成的向量。
则
(1)
*
(1)
(1)
*
11
(,)(,)Cov Cov ==U X A X X A Σ
(1)(1)(1)(1)1/2
(1)(1)(,)()()(,)
()
i k i k
i k i k
i kk k k Corr U X D U D X Cov U X D X σ-=
=
=
这里()1i
D U =,
(1)1/2
()k kk
D X σ=。
记1/211
V -为对角元素是1/2kk
σ
-的对角阵,所以有
(1)(1)1/2(1)
11,*(1)
1/2
(1)*
1/2111111
(,)(,)
(,)U X Corr Cov Cov ---====R U X U V X A X V
X A ΣV
类似可得: (2)
*
1/222
22
,V X -=R B ΣV (2)
*1/2
1222
,U X
-=R
A ΣV
(1)*1/2
2111
,V X -=R B ΣV
对于经过标准化处理后得到的典型变量有:
(1)*11
,Z U Z =R A R ;
(2)*22
,Z V Z =R B R
(2)*12
,Z U Z =R A R ;(1)
*21
,Z V Z
=R
B R
对于样本典型相关分析,上述结果中的数量关系同样成立。
9.5 简述典型相关分析中冗余分析的内容及作用。
答:典型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量。
第一组变量样本的总方差为11
()tr p =R ,第二组变量样本的总方差为22
()tr q =R 。
*
ˆz A
和*ˆz
B 是样本典型相关系数矩阵,典型系数向量是矩阵的行向量,*(1)
ˆˆz
=U
A Z ,*(2)
ˆˆz
=V B Z 。
前r 对典型变量对样本总方差的贡献为
(1)(1)(1)(2)(2)
()()
2
ˆ,11
ˆˆˆˆˆˆ()i
k p
r r r z z z z z z
z U i k tr r =='''+++=∑∑a a a a a a
(2)(1)(1)(2)(2)()()2ˆ,11
ˆˆˆˆˆˆ()i
K
q r
r r z z z z
z z z V
i k tr r =='''+++=∑∑b b b b b b
则第一组样本方差由前r 个典型变量解释的比例为(1)(1)2
ˆ,11
ˆ|i
k p
r z U i k z U
r
d
p
===
∑∑R
第二组样本方差由前r 个典型变量解释的比例为
(2)(2)2ˆ,11
ˆ|i
k q
r
z V i k z V r
d q
===
∑∑R
9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变量分别为()
i a
X
'、()
i b Y ',典型相关系数为i
λ,(1,
,)
i p =。
令
*X CX l
=+,*
Y
DY m
=+,其中C 、D 分别为,p p q q ⨯⨯阶非
奇异阵,l 、m 分别为p 维、q 维随机向量,试证明
⑴ *
*
X Y 、的第i 对典型变量为1
()*
i C
a X -'、1
()*
i D
b Y -'。
⑵ 1
()*
i C
a X -'与1
()*
i D
b Y -'的典型相关系数为i
λ。
9.7 对140名学生进行了阅读速度1
x 、阅读能力2
x 、运算速度1
y 和运算能力2
y 的四种测验,所得成
绩的相关系数阵为
1
0.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢
⎥⎢⎥⎢⎥⎣⎦
=
试对阅读本领与运算本领之间进行典型相关分析。
解:根据已知可得
==
=
=
计算得
的特征值为
提取第一典型变量为
其中,
分别为原始变量
标准化后的结
果。
按照常识,不应该有负数系数啊?不知道怎么回事。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成绩如下表:
闭卷 开卷 闭卷 开卷 力学 物理 代数
分析
统计
力学 物理 代数
分析
统计
1X 2X
3X
4X
5X
1X 2X
3X
4X
5X
77 82 67 67 81 63 78 80 70 81 75 73 71 66 81 55 72 63 70 68 63 63 65 70 63 53 61 72 64 73 51 67 65 65 68 59 70 68 62 56 62 60 58 62 70 64 72 60 62 45 52 64 60 63 54 55 67 59 62 44 50 50 64 55 63 65 63 58 56 37 31 55 60 57 76 60 64 56 54 40 44 69 53 53 53 42 69 61 55 45 62 46 61 57 45 31 49 62 63 62 44 61 52 62 45 49 41 61 49 64 12 58 61 63 67 49 53 49 62 47 54 49 56 47 53 54 53 46 59 44 44 56 55 61 36 18 44 50 57 81 46
52
65
50
35
32
45
49
57
64
30 69 50 52 45 46 49 53 59 37 40 27 54 61 61 31 42 48 54 68 36 59 51 45 51 56 40 56 54 5 46 56 57 49 32 45 42 55 56 40 42 60 54 49 33 40 63 53 54 25 23 55 59 53 44 48 48 49 51 37 41 63 49
46
34 46 52 53
41
40
试对闭卷(1
X ,2
X )和开卷(3
X ,4
X ,5
X )两组变量进行典型相关分析。
9.9 邓讷姆(Dunham )在研究职业满意度与职业特性的相关程度时,对从一大型零售公司各分公司挑出的784位行政人员测量了5个职业特性变量:用户反馈、任务重要性、任务多样性、任务特性及自主性,7个职业满意度变量:主管满意度、事业前景满意度、财政满意度、工作强度满意度、公司地位满意度、工种满意度及总体满意度。
两组变量的样本相关矩阵为:
11 1.00
0.49 1.00ˆ0.53
0.57 1.00
0.490.460.48 1.000.51
0.530.570.57 1.00R ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥
⎢⎥⎢⎥⎣⎦
22 1.000.43 1.000.270.33 1.00ˆ0.240.260.25 1.000.340.540.460.28 1.00
0.370.320.290.300.35 1.000.400.580.45
0.27
0.590.31 1.00R ⎡⎤
⎢⎥⎢⎥⎢⎥⎢⎥=⎢
⎥⎢⎥⎢⎥
⎢⎥⎢⎥⎣
⎦
12210.330.320.200.190.300.370.210.300.210.160.080.270.350.20ˆˆ0.310.230.140.070.240.370.180.24
0.220.120.190.210.290.160.380.320.170.230.320.360.27R R ⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦
试对职业满意度与职业特性进行典型相关分析。
9.10 试对一实际问题进行典型相关分析。