当前位置：文档之家› 多元统计分析模拟考题及答案

多元统计分析模拟考题及答案

10 设 X,Y 是来自均值向量为，协差阵为的总体 G 的两个样品，则 X 与总体 G 的马氏平方距离 d 2 ( X ,G) = ( X )1( X )
11 设随机向量 X ( X1, X 2 , X3 ) 的相关系数矩阵通过因子分析分解为
1
R
1 3
2 3
1 3 1
0
2
3
16 设Uk ,Vk 是第 k 对典型变量则 D(Uk ) 1, D(Vk ) 1 (k 1, 2, , r)
Cov(Ui ,U j ) 0, Cov(Vi ,Vj ) 0 (i j)
i 0 (i j,i 1, 2, , r)
Cov(Ui ,Vj ) 0
(i j)
0
( j r)W来自x1 x2W3 5
d
故
X
3 5
属于
G2 总体
5 表 1 是根据某超市对不同品牌同类产品按畅销（1）、平销（2）和滞销（3）的数据，
利用 SPSS 得到的 Bayes 判别函数系数表，请据此建立贝叶斯判别函数，并说明如何判
断新样品（x1,x2,x3）属于哪类？
Classification Function Coefficients
2. 请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法，比较其异同
3 请阐述系统聚类法、K 均值聚类法、有序样品聚类法的基本思想和方法，比较其异同
4 请阐述主成分分析和因子分析的基本思想、方法步骤和应用，比较其异同 5 请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应用
（错）5 X ( X1, X 2 ,, X p ) ~ N p (, ) ， X , S 分别是样本均值和样本离差阵，则 X , S 分别是 , 的无偏估计。
n （对）6 X ( X1, X 2 ,, X p ) ~ N p (, ) ， X 作为样本均值的估计，是
无偏的、有效的、一致的。
Group1： Y1 81.84311.689X112.297X 2 16.761X 3 Group2： Y 2 94.53610.707X113.361X 2 17.086X 3 Group3： Y3 17.449 2.194X1 4.960X 2 6.447X 3
将新样品的自变量值代入上述三个 Bayes 判别函数，得到三个函数值。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。
故Y
D(0.5X1 X 2 0.5X3 1) 3
D(0.5X1 0.5X3 2) 1
COV (0.5X1 X 2 0.5X3 1, 0.5X1 0.5X3 2) 1
N3(E(Y ), D(Y ))
2. 设三维随机向量 X
2 1 1 1
N3(, )
，已
知
3
,
1
6. 对某数据资料进行因子分析，因子分析是从相关系数阵出发进行的，前两个特征根
和对应的标准正交特征向量为
1 2.920 U1' (0.1485, 0.5735, 0.5577, 0.5814)
，
1 2.920 U1' (0.1485, 0.5735, 0.5577, 0.5814)
(1) 取公因子个数为 2，求因子载荷阵
DY
D( AX
d)
ADXA
1
1
2 0
1 1
1 0.5
0
0.5
3 1
1
1
所以Y N3(E(Y ), D(Y )) 另解：
Y
AX
d
0.5X1 X 2 0.5X3 1
0.5X1 0.5X3 2
E(0.5X1 X 2 0.5X3 1) 2
E(0.5X1 0.5X3 2) 1
故Y N(13,9)
3 设有两个二元总体和
，从中分别抽取样本计算得到
,
,
假设
，试用距离判别法建立判别函数和
判别规则。样品 X=（6，0）’应属于哪个总体？
解： =
，=
，=
=
即样品 X 属于总体
4
设已知有两个正态总体 G1, G2
,且
1
2 6
,
2
4
2
,
1
2
1 1
1 9
，而其
先验概率分别为 q1 q2 0.5, 误判的代价 L(2 |1) e4, L(1| 2) e ，试用贝叶斯判别
3
2
，
求
1 1 2 2
Y 3X1 2X 2 X3 的分布解：正态分布的任意线性组合仍正态，故 Y 的分布是一维正态分布，只需求 E(Y ) 3E(X1) 2E( X 2) E( X3) 13 D(Y ) 32 E( X1) 22 E( X2 ) E( X3) 2Cov(3X1, 2X 2) 2Cov(3X1, X3) 2Cov( X3, 2X 2) 9
(2) 用 F1F2 表示选取的公因子，1,2 为特殊因子，写出因子模型，说明因子载荷
阵中元素 aij 的统计意义
7 在一项对杨树的形状研究中，测定了 20 株杨树树叶，每个叶片测定了四个变量
X1, X 2 , X3, X 4 分别代表叶长，叶子 2/3 处宽，1/3 处宽，1/2 处宽，这四个变量的相
group
1
2
3
x1
-11.689 -10.707 -2.194
x2
12.297 13.361 4.960
x3
16.761 17.086 6.447
(Constant )
-81.843 -94.536 -17.449
Fisher's linear discriminant functions
表1 Bayes判别函数系数解：根据判别分析的结果建立 Bayes 判别函数： Bayes 判别函数的系数见表 4.1。表中每一列表示样本判入相应类的 Bayes 判别函数系数。由此可建立判别函数如下：
关系数矩阵的特征根和标准正交特征向量分别为：
1 2.920 U1' (0.1485, 0.5735, 0.5577, 0.5814)
2
1.024
U
' 2
(0.9544, 0.0984, 0.2695, 0.0824)
3
0.049
U
' 3
(0.2516, 0.7733, 0.5589,
0.1624)
（错）7 因子载荷经正交旋转后，各变量的共性方差和各因子的贡献都发生了变化（对）8 因子载荷阵 A (aij ) 中的 aij 表示第 i 个变量在第 j 个公因子上
的相对重要性。（对）9 判别分析中，若两个总体的协差阵相等，则 Fisher 判别与距离判别等
价。（对）10 距离判别法要求两总体分布的协差阵相等，Fisher 判别法对总体的分布无特定的要求。
法确定样本
X
3 5
属于哪个总体？
解：由 Bayes 判别知，W (x)
f1 ( x) f2 ( x)
exp[( x
)1(1
2
)]
其中
1 2
(1
2 )
1 2
2
6
4
2
3 4
1
1 8
9 1
1
1
,
1
2
2
4
d q2C(1| 2) e3 q1C(2 |1)
W
(
x)
标准化变量 X1 的方差为 1，公因子 f1 对 X 的贡献 g12 0.9342+0.4172+0.8352=1.743
12. 对应分析是将 Q 型因子分析和 R 型因子分析结合起来进行的统计分析方法
13 典型相关分析是研究两组变量间相关关系的一种多元统计方法 14. 聚类分析中，Q 型聚类是指对样本进行聚类，R 型聚类是指对指标进行聚类。 15 Spss for windows 中主成分分析由 Data Reduction->Factor Analysis 过程实现。
为： 1 2.920 U1' (0.1485, 0.5735, 0.5577, 0.5814)
2
1.024
U
' 2
(0.9544, 0.0984, 0.2695, 0.0824)
3
0.049
U
' 3
(0.2516, 0.7733, 0.5589,
0.1624)
4
0.007
U
' 4
(0.0612, 0.2519, 0.5513, 0.7930)
10
6 设 Xi N3(, ),i 1, 2, ,10，则W ( Xi )( Xi ) 服从W3(10, ) i 1
4 4 3
7. 设随机向量
X
( X1, X 2 , X3 )
，且协差阵
4
9
2
，
则
其
相关
矩
阵
3 2 16
1
R=
2 3
3
8
2 3
1
1 6
3 8
1 6
1
0.934
0
0.417 0.835
1
0
0.894 0.447
0.934 0
0.417 0.894
0.128
0.835 0.447
0.027
0.103
则 X1 的共性方差 h12 0.9342 =0.872 ，其统计意义是：描述了全部公因子对变量 X1
的总方差所作的贡献，称为变量 X1 的共同度，反映了公共因子对变量 X1 的影响程度。

e商务文档

多元统计分析模拟考题及答案

相关文档推荐：