一、判断题( 对) 1 X( X 1 , X 2 ,L , X p )的协差阵一定是对称的半正定阵( 对() 2 标准化随机向量的协差阵与原变量的相关系数阵相同。
对) 3 典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。
( 对)4 多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。
( 错)5 X(X 1 , X 2 , , X p ) ~ N p ( , ) , X , S 分别是样本均值和样本离差阵,则 X , S分别是 ,的无偏估计。
n( 对) 6 X( X 1 , X 2 , , X p ) ~ N p ( , ) , X 作为样本均值的估计,是无偏的、有效的、一致的。
( 错) 7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化(对) 8 因子载荷阵 A( ij ) ij表示第 i 个变量在第 j 个公因子上a 中的 a 的相对重要性。
( 对)9 判别分析中, 若两个总体的协差阵相等, 则 Fisher 判别与距离判别等价。
(对) 10 距离判别法要求两总体分布的协差阵相等, Fisher 判别法对总体的分布无特定的要求。
二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、 样本相关系数矩阵.2、 设 是总体的协方差阵, 的特征根(1, , ) 与相应的单 X ( X 1,L , X m )i i L m位 正 交 化 特 征 向 量i ( a i1, a i 2 ,L ,a im ) , 则 第 一 主 成 分 的 表 达 式 是y 1 a 11 X 1 a 12 X 2 La 1m X m ,方差为1 。
3 设是总体 X( X 1, X 2 , X 3, X 4 ) 的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U 1'(0.1485, 0.5735, 0.5577, 0.5814)21.024 U 2' (0.9544,0.0984,0.2695,0.0824)30.049 U 3' (0.2516,0.7733, 0.5589, 0.1624)40.007 U 4'(0.0612,0.2519,0.5513,0.7930) ,则其第二个主成分的表达式是y20.9544 X10.0984 X 20.2695 X 30.0824 X 4,方差为 1.0244.若 X () ~ N p( ,) ,(1,2, , n )且相互独立,则样本均值向量X 服从的分布是 N p (,) .n5.设X i: N p(,), i1,2,L,16 , X 和A分别是正态总体的样本均值和样本离差阵,则 T 215[4( X)] A 1[4( X)] 服从 T2 (15, p)或15 p: F ( p, n p) 16p106 设X i: N3(,), i1,2,L,10 ,则 W( X i)( X i) 服从 W3 (10, )i 14437.设随机向量X( X1 , X 2 , X3 ),且协差阵492,则其相关矩阵3216123 38R =12136311868.设 X(X1, X 2 ) : N 2 ( , ), ,其中( 1 , 2 ),21,则1Cov( X1X 2 , X1X 2 )09 设 X,Y 是来自均值向量为,协差阵为的总体 G 的两个样品,则X,Y 间的马氏平方距离 d2 ( X ,Y )(X Y)1 ( X Y )10 设 X,Y 是来自均值向量为,协差阵为的总体 G的两个样品,则X 与总体 G的马氏平方距离 d 2 ( X , G) = ( X)1 ( X)11 设随机向量X( X1, X 2 , X 3 ) 的相关系数矩阵通过因子分析分解为112330.93400.1280.9340.4170.8351R100.4170.8940.027 300.8940.4470.8350.4470.1032013则 X1的共性方差 h120.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量 X1的共同度,反映了公共因子对变量X1 的影响程度。
标准化变量 X1的方差为1,公因子f1 对 X 的贡献g120.9342+0.4172+0.8352=1.74312.对应分析是将Q 型因子分析和 R 型因子分析结合起来进行的统计分析方法13 典型相关分析是研究两组变量间相关关系的一种多元统计方法14.聚类分析中, Q 型聚类是指对样本进行聚类, R 型聚类是指对指标进行聚类。
15Spss for windows中主成分分析由 Data Reduction->Factor Analysis 过程实现。
16 设U k,V k是第k对典型变量则 D (U k )1, D (V k )1(k 1,2,L ,r )Cov (U i ,U j )0,Cov (V i ,V j ) 0(i j )i0(i j , iL, r ) 1,2,Cov(U i ,V j )0(i j )0( j r )17. 在多维标度分析中,当 D 是欧几里得距离阵时, X 是 D 的一个构图三、简答题(答案见平时习题)1 简述多元统计的主要内容与方法(10 分)可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、数字特征、四大分布(正态分布密度(1 分)、2 (n)与威沙特分布Wp(n, )(1 分)、t 分布与 Hoteling T 2分布( 1分)、F 分布与威尔克斯分布( p,n1 , n2 )(1分))、抽样分布定理、参数估计和假设检验、统计方法( 2 分)2. 请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同3 请阐述系统聚类法、K 均值聚类法、有序样品聚类法的基本思想和方法,比较其异同4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应用四、计算题1设三维随机向量X : N 3 ( , 2I 3 ),已知21000.510.510 , I 3010, A, d,求 Y AX d 的分布00010.500.52解:正态分布的线性组合仍为正态,故只需求E(Y )E(AX d)AEX d1121211210.50.51DY D ( AX d )13ADXA010110.51 0.5所以 Y : N 3( E (Y), D (Y ))另解:0.5X1X 20.5X31Y AX d0.5X10.5X32E(0.5X1X 2 0.5X 31)2E( 0.5X10.5X 32)1故 Y : N 3 (E(Y ), D (Y))D(0.5 X1X 2 0.5X31)3D( 0.5X10.5X 32)1COV (0.5X1 X 20.5X 31, 0.5X10.5X 32) 121112. 设三维随机向量X : N3( ,) ,已知 3 , 1 3 2 ,求1122Y 3X1 2 X2 X 3的分布解:正态分布的任意线性组合仍正态,故Y 的分布是一维正态分布,只需求E(Y ) 3E(X1 ) 2E( X 2 )E( X 3 )13D(Y) 32 E( X1 )22 E( X 2 )E( X 3 )2Cov(3X1,2 X2 )2Cov(3 X1, X3 )2Cov( X 3,2 X2 ) 9故Y : N (13,9)3设有两个二元总体和,从中分别抽取样本计算得到,,假设,试用距离判别法建立判别函数和判别规则。
样品 X=( 6, 0)’应属于哪个总体?解:=,=,==即样品 X 属于总体4 设已知有两个正态总体G 1, G 2 , 且 1241 1 ,2 ,121,而其629先验概率分别为q 1 q 2 0.5, 误判的代价 L(2 |1)e 4 , L(1| 2) e ,试用贝叶斯判别法确定样本 X3属于哪个总体?5解:由 Bayes 判别知, W (x)f 1 (x) exp[( x)1 (12 )]f 2 (x)1( 12 )12 4 36 24其中221 91218 1, 121 4q 2C (1| 2)3deq 1C (2 |1)W ( x)x 1 W3 dW5x 2故 X3属于 G2 总体55 表 1 是根据某超市对不同品牌同类产品按畅销(1)、平销( 2)和滞销( 3)的数据,利用 SPSS 得到的 Bayes 判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判断新样品( x1,x2,x3 )属于哪类?Classification Function Coefficientsgroup12 3x1 -11.689 -10.707 -2.194x212.29713.3614.960x316.761 17.086 6.447(Constant-81.843 -94.536 -17.449)Fisher's linear discriminant functions表 1 Bayes 判别函数系数解:根据判别分析的结果建立Bayes 判别函数:Bayes 判别函数的系数见表4.1 。
表中每一列表示样本判入相应类的Bayes 判别函数系数。
由此可建立判别函数如下:Group1: Y1 81.843 11.689 X 1 12.297 X 2 16.761X 3 Group2: Y 294.536 10.707 X 1 13.361X 2 17.086 X 3Group3:Y 3 17.449 2.194 X 1 4.960 X 2 6.447 X 3将新样品的自变量值代入上述三个Bayes 判别函数,得到三个函数值。
比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。
6. 对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的, 前两个特征根 和对 应 的 标 准正交特征向量为 12.920 U 1' (0.1485, 0.5735, 0.5577, 0.5814),12.920 U 1'(0.1485, 0.5735, 0.5577, 0.5814)(1) 取公因子个数为 2,求因子载荷阵(2) 用 F1F2 表示选取的公因子,1,2 为特殊因子, 写出因子模型, 说明因子载荷阵中元素 a ij 的统计意义7 在一项对杨树的形状研究中,测定了 20 株杨树树叶,每个叶片测定了四个变量X 1, X 2 , X 3 , X 4 分别代表叶长,叶子2/3 处宽, 1/3 处宽, 1/2 处宽,这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:12.920 U 1' (0.1485, 0.5735, 0.5577, 0.5814) 21.024 U 2' (0.9544, 0.0984,0.2695,0.0824) 30.049 U 3' (0.2516,0.7733, 0.5589, 0.1624) 40.007 U 4' ( 0.0612,0.2519,0.5513,0.7930)若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡献率解:选取主成分的一般原则是特征值大于 1 或累积贡献率达到80%以上。