《多
元
统计
分
析》
试卷
题号 一 二 三 总分 分值 40
40
20 100
得分
1、若
),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为)1
,(~∑n
N X p μ。
2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。
3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。
4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。
5、设样品),2,1(,),,('21n i X X X X ip i i i ==,总体),(~∑μp N X ,对样品进行分类常用的距离有:明氏距离q
p
q
j i ij x x q d 1
1
)||(
)(∑=-=ααα,马氏距离2()ij d M =)()(1j i j i x x x x -∑'--,兰氏距离()ij d L =
∑=+-p
j i j i x x x x 1
||α
α
ααα。
6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。
7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型是:
εββββ++++=p p x x x y 22110。
8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。
得分
评卷
人
一、填空题(每空2
分,共40分)
9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
1、设三维随机向量
),(~3∑μN X ,
其中
⎪⎪⎪
⎭
⎫ ⎝⎛=∑200031014,问1X 与2X 是否独立?),(21'X X 和3X 是否独立?为什么?
解: 因为1),cov(21=X X ,所以1X 与2X 不独立。
把协差矩阵写成分块矩阵⎪⎪⎭
⎫
⎝⎛∑∑∑∑=∑22211211
,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不相关与相
互独立是等价的,所以),(21'X X 和3X 是独立的。
2、设抽了五个样品,每个样品只测了一个指标,它们分别是
1 ,
2 ,4.5 ,6 ,8。
若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。
解:样品与样品之间的明氏距离为:⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛
=02
5
.367
05.14505
.25.30
105
432154
3
2
1)
0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法)
得距离阵 ⎪⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛
=025.3705.1505.30}
,{},{54
32154321)
1(x x x x x x x x x x D 得分
评卷
人
二、计算题(每小题10分,共40分)
类与类的最短距离是1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵⎪⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛
=05.3705),{0}
,{},{},{5
432154321)
2(x x x x x x x x x x D 类与类的最短距离是3.5,故把543},{X X X 与合并为一类,计算类与类之间距离(最长距离法)得距离阵⎪⎪⎪⎭
⎫ ⎝⎛
=07},,{0},{},,{},{5432154321)
3(x x x x x x x x x x D 分类与聚类图(略)(请你们自己做)
3、设变量123,,X X X 的相关阵为 1.000.630.450.63 1.000.35,0.450.35 1.00R R ⎛⎫
⎪
= ⎪ ⎪⎝⎭
的特征值和单位化特征向量分别为
(1) 取公共因子个数为2,求因子载荷阵A 。
(2) 计算变量共同度2i h 及公共因子j F 的方差贡献,并说明其统计意义。
解:因子载荷阵⎪⎪⎪⎪⎭
⎫
⎝⎛--=68.084.096.151.068
.049.096.159.068
.022.096.163.0A 变量共同度:2221)68.022.0()96.163.0(-+=h =
2222)68.049.0()96.159.0(-+=h =
2223)68.084.0()96.151.0(+=h =
公共因子j F 的方差贡献: 统计意义(省略)(学生自己做)
4、设三元总体X 的协方差阵为⎪⎪⎪
⎭
⎫
⎝⎛=∑600030001,从∑出发,求总体主成分123,,F F F ,并求前两个
主成分的累积贡献率。
解:
特征方程0||=∑-E λ,得特征根:1,3,6321===λλλ
61=λ的特征方程:0000030005321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=1001u
31=λ的特征方程:0300000002321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-x x x ,得特征向量⎪⎪⎪
⎭⎫ ⎝⎛=0102u
11=λ的特征方程:0500020000321=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛--x x x ,得特征向量⎪⎪⎪
⎭
⎫ ⎝⎛=0013u
前两个主成分的累积贡献率
9.010
9
= 简述多元统计的主要内容,结合你本专业谈谈能用到那些统计方法。
(省略)(学生自己做)
得分
评卷
人
三、简述题(20分)。