当前位置:文档之家› 厦门大学《应用多元统计分析》试题B答案

厦门大学《应用多元统计分析》试题B答案

3. 相应分析指受制于某个载体总体的两个因素为 A 和 B ,其中因素 A 包含 r 个水平,
即 A1, A2 ," Ar ;因素 B 包含 c 个水平,即 B1, B2 ," Bc 。对这两组因素作随机抽样
调查,得到一个 r × c 的二维列联表,记为 K = (kij )r×c ,主要目的是寻求列联表行
432
51
所以 X 属于正态总体 G1 。
2. 解:由题意得:
G1
G2
G3
G4
G5
G1
0
G2
4
0
G3
6
9
0
G4
1
7
Hale Waihona Puke 100G5
6
3
5
8
0
D(0)中最小的元素是 D14=1,将 G1 和 G4 合并成 G6,用最长距离法计算新类与其他类之间的距 离,得到新的距离矩阵 D(1):
G6
G2
G3
G5
G6
0
G2
义类间距离平方为这两类元素两两之间距离平方的平均数;可变类平均法将 G p 和
Gq 合并为新类 Gr ,反映出 G p 和 Gq 之间的距离 Dpq 的影响;如果中间法的前两
项的系数也依赖于 β ,那么用可变法如果将 G p 和 Gq 合并为新类 Gr ;离差平方和
法则是先将 n 个样品各自成一类,然后每次缩小一类,每缩小一类,离差平方和就 要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止 2. 主成分分析与因子分析的相同点:两者都是一种降维,简化数据的技术;两种方法 的求解过程是类似的,都是从协方差出发,利用特征值、特征向量求解。 不同点:主成分分析的数学模型本质上是一种线形变换,将原始坐标变换到变异程 度最大的方向上,突出数据变异的方向,归纳重要信息。而因子分析是从现在变量 去提取潜在因子的过程。
Y1
=
1 2
X1
+
2 2
X2
+
1 2
X3
, Y2 =
2 2
X1

2 2 X3
, Y3
=
1 2
X1

2 2
X2
+
1 2
X3

4. 解:
⎜⎛ λ1
⎟⎞
A
=
(l1
,
l
2
,
l
3
)⎜
⎜⎜⎝
λ2
⎟ λ3 ⎟⎟⎠
⎜⎛ 0.6250 = ⎜ 0.5932
⎜⎝ 0.5075
− 0.2186 − 0.4911 − 0.8432
计算共因子的方差贡献得:
0.6795
⎟⎞

0.3572
⎟ ⎟
⎟⎠
g12
=
λ1
= 1.9633;
g
2 2
=
0.6795; g32
=
0.3572 ,分别为公共因子
F1,
F2 ,
F
对X
的贡
献,是衡量每个公共因子的相对重要性的尺度。
0.7494 − 0.6379
⎟⎞⎜⎜⎛ ⎟⎜
1.9633
− 0.1772⎟⎠⎜⎜⎝
⎜⎛ 0.8757 − 0.1802 0.4479 ⎟⎞ = ⎜ 0.8312 − 0.4048 − 0.3812⎟
⎜⎝ 0.7111 − 0.6951 − 0.1059⎟⎠
建立因子模型:
X1 = 0.8757F1 − 0.1802F2 + 0.4479F3 X 2 = 0.8312F1 − 0.4048F2 − 0.3812F3 X 3 = 0.7111F1 − 0.6951F2 − 0.1059F3
⎟⎟⎠⎞⎜⎜⎝⎛150
⎟⎟⎠⎞

(0
,- 5)
1 51
⎜⎜⎝⎛
5 7
7 20
⎟⎟⎠⎞⎜⎜⎝⎛
-05⎟⎟⎠⎞
=
25 432
(2 ,1)⎜⎜⎝⎛
32 - 12
- 12 18
⎟⎟⎠⎞⎜⎜⎝⎛
2 1
⎟⎟⎠⎞

1 51
(0
,- 5)⎜⎜⎝⎛
5 7
7 20
⎟⎟⎠⎞⎜⎜⎝⎛
-05⎟⎟⎠⎞
= 25 × 98 − 500 〈0
i=0
i=0
Z 是 μ 的无偏估计量得证;
2) X1 "Xn 独立同分布于 N p (μ, Σ) ,
∑ ∑ ( ) ∑ ( ) ∑ ( ) D Z
=
D⎜⎛ ⎝
n i=0
ci
X(i
)
⎟⎞ ⎠
=
n i=0
D
ci X(i)
n
= ci2D X(i)
i=0
n
= ci2 ∑ = c′c ∑ ,
i=0
且由(1)中结论可知 E(Z) = μ
关系。
4. 典型相关分析是研究两组变量之间相关关系的一种多元统计方法,目的为识别并量
化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合
与另一组变量线性组合之间的相关关系分析。基本思想为:设
( ) ( ) X (1) =
X
(1)
1
,
X
(1)
2
"
X
(1)
p


X
(2)
=
X
(2)
1
,
谱系聚类图:
G1
G6
G4
G8
G2
G7
G9
G5
G3
3. 解:先求三元总体 X 的协方差阵 ∑ 的特征根,
σ2 −λ ∑ −λE = ρσ 2
0
ρσ 2 σ2 −λ
ρσ 2
0
( )( ) ρσ 2 = σ 2 − λ σ 4 − 2λσ 2 + λ2 − 2ρ 2σ 4 = 0
σ2 −λ
( ) ( ) 解得: λ1 = 1+ 2ρ σ 2, λ2 = σ 2, λ3 = 1− 2ρ σ 2
( ) λ1 = 1+

σ
2
对应的单位特征根为 T1
=
⎜⎜⎝⎛
1 2
,
2 2
,
1 2
⎟⎟⎠⎞

λ2 = σ 2 对应的单位特征根为 T2 = ⎜⎜⎝⎛
2 ,0,− 2
2 2
⎟⎟⎠⎞

( ) λ3 = 1−

σ
2 对应的单位特征根为 T3
=
⎜⎜⎝⎛
1 2
,−
2 2
,
1 2
⎟⎟⎠⎞

因此,总体的主成分为:
7
0
G3
10
9
0
G5
8
3
5
0
D(1)中最小的元素是 D25=3,将 G2 和 G5 合并成 G7,用最长距离法计算新类与其他类之间的距 离,得到新的距离矩阵 D(2):
G6
G7
G3
G6
0
G7
8
0
G3
10
9
0
然后将 G6 和 G7 合并成 G8,最后将 G8 和 G3 合并成 G9,五个样品聚为一类。
所以, Z ~ N p (μ,c'cΣ) ,其中 c = (c1,", cn )' 成立。
三、简答题
1. 最短距离法为类 Gi 与 G j 之间的距离为两类最近样品的距离;最长距离法为类 Gi
与 G j 之间的距离为两类最远样品的距离;中间距离法用介于最长与最短两者之间
的距离;重心法定义类间距离为两类重心(各类样品的均值)的距离;类平均法定
X
(2
2
)
"
X
(2
q
)

是两个相互关联的随机向
量,分别在两组变量中选取若干有代表性的综合变量 Ui、Vi,使得每一个综合变量
是原变量的线性组合,即
Ui
=
a1(i ) x1(i )
+ a2(i)x2(i)
+
"
+
a
(i
p
)
x
(i
p
)

Vi = b1(i)x1(i) + b2(i)x2(i) + " + bp(i)x(pi) 。在 D(a(1)′ X (1) ) = D(b(1)′ X (2) ) = 1 的条件下,
多元统计分析 试卷 B(答案)
一、判断并改错 对;对;对;对;错(典型相关分析是研究两组变量之间相关关系的一种多元统计方法。)
二、解: 1)
∑ ∑ ( ) ∑ ( ) ∑ ∑ ( ) E Z =
E⎜⎛ n ⎝ i=0
ci
X
(i
)
⎟⎞ ⎠
=
n i=0
E
ci X(i)
n
= ci E X(i)
i=0
n
n
= ci μ = μ ci = μ
因素 A 和列因素 B 的基本分析特征和它们的最优联立表示。基本思想为通过列联
表的转换,使得因素 A 和列因素 B 具有对等性,这样就可以用相同的因子轴同时
描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同
坐标轴的因子平面上,直观地描述两个因素 A 和因素 B 以及各个水平之间的相关
使得 ρ (a(1)′ X (1) , b(1)′ X (2) ) 达到最大, a(1)′ X (1) 、 b(1)′ X (2) 是 X (1) 、 X (2) 的第一对
典型相关变量。可以类似的求出各对之间互不相关的第二对、第三对等典型相关变
相关主题