、判断题(对)1X (兀公2丄,X p)的协差阵一定是对称的半正定阵(对)2标准化随机向量的协差阵与原变量的相关系数阵相同。
(对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。
(对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。
(错)5X (X-X2,,X p) ~ N p( , ),X,S分别是样本均值和样本离S差阵,则X,—分别是,的无偏估计。
n(对)6X (X「X2, ,X p) ~ N p( , ),X作为样本均值的估计,是无偏的、有效的、一致的。
(错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化(对)8因子载荷阵A (a j)中的a ij表示第i个变量在第j个公因子上的相对重要性。
(对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。
(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。
二、填空题1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵.2、设是总体X (X」,X m)的协方差阵,的特征根i(i 1,L ,m)与相应的单位正交化特征向量i (盼无丄,a m),则第一主成分的表达式是y1 Q1X1 812X2 L QmX m 方差为1。
3设是总体X (X1,X2,X3, X4)的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U;(0.1485, 0.5735, 0.5577, 0.5814)2 1.024 U2(0.9544, 0.0984,0.2695,0.0824)3 0.049 U3(0.2516,0.7733, 0.5589, 0.1624)0.007U4 ( 0.0612,0.2519,0.5513, 0.7930),则其第二个主成分的表达式是41 1 32 13y 2 0.9544X 1 0.0984X 2 0.2695X 3 0.0824X 4,方差为 1.0244-若X ()~N p ( , ) , ( 1,2, ,n )且相互独立,则样本均值向量 X 服从的分布是N p (,—).n5.设X i : N p ( , ),i 1,2,L ,16,X 和A 分别是正态总体的样本均值和样本离差阵,则 T 2 15[4(X)] A 1[4(X)]服从_T 2(15,p)或: F(p,n p)16 p6设X i 10:N a (,),i1,2丄,10,则 W(X i)(X i)服从 W 3(10,)i 14 4 37.设随机向量X(X 1 ,X 2,X a ),且协差阵4 92 ,则其相关矩阵32 1612 3R =382 1 1 363 1 1862 1 8. 设X (X 1 ,X 2): :2(,),,其中(1,2),2,则1Cov(X 1 X 2,X 1 X 2)0_9设X,Y 是来自均值向量为,协差阵为 的总体G 的两个样品,则 X ,Y 间的马氏平2 1方距离 d (X,Y) (X Y) (X Y) 10设X,Y 是来自均值向量为 ,协差阵为的总体G 的两个样品,则 X 与总体G 的马氏平方距离d 2(X,G) =(X)1(X )11设随机向量X (X 1,X 2,X 3)的相关系数矩阵通过因子分析分解为0.934 0 0.1280.934 0.417 0.8350.417 0.894 0.0270 0.894 0.4470.835 0.447 0.1031 1 32 132则X i 的共性方差hi0.9342 =0.872 ,其统计意义是:描述了全部公因子对变量X1的总方差所作的贡献,称为变量X1的共同度,反映了公共因子对变量X1的影响程度。
_ 2标准化变量 X1的方差为 1 公因子fl 对X 的贡献g 10.9342+0.4172+0.8352=1.74312.对应分析是将 Q 型因子分析 和R 型因子分析 结合起来进行的统计分析方法13典型相关分析是研究两组变量间 相关关系 的一种多元统计方法14.聚类分析中,Q 型聚类是指对 样本进行聚类,R 型聚类是指对 指标 进行聚类。
15Spss for windows 中主成 分分析 由 Data Reduction->Factor Analysis 过程实现。
16 设U k ,V k 是第 k 对典型变量则D (UQ 1, D (V k ) 1 (k 1,2,L ,r )Cov(U i ,U j ) 0,Cov(V i ,W) 0 (i j) (i j,i 1,2,L ,r)(i j)(j r)17.在多维标度分析中,当 D 是欧几里得距离阵时, X 是D 的一个构图 三、简答题(答案见平时习题)1简述多元统计的主要内容与方法(10分)可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、2(n ) 与威沙特分布W p ( n,) (1分)、t 分布与Hoteli ng T 2分布(1分)、F 分布 与威尔克斯分布(p,门1山2)( 1分))、抽样分布定理、参数估计和假设检验、 统计方法(2分)2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同3请阐述系统聚类法、K 均值聚类法、有序样品聚类法的基本思想和方法,比较其异同 4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应 用四、计算题设三维随机向X : N 3( ,213)2 0 ,13 01 0 0 0 1 0 ,A 0 0 10.5 1 0.5 ,d0.50.5,求Y AX d 的分布Cov(UiM )解:正态分布的线性组合仍为正态,故只需求E(Y) E(AX d) AEX d1DY D(AX d) ADXA1 所以 Y : N 3(E(Y), D(Y)) 另解:Y AX d0^X 1 X 2 0.5X 3 10.5X 1 O.5X 3 21 1 11 3 2,求1 2 2Y 3X 1 2X 2 X 3的分布解:正态分布的任意线性组合仍正态,故 丫的分布是一维正态分布,只需求 E(Y) 3E(XJ 2E(X 2)E(X 3)13D(Y) 32E(X 1) 22E(X 2) E(X 3) 2Cov(3X 1,2 X 2) 2Cov(3X 1,X 3) 2Cov(X 3,2X 2) 9 故Y : N(13,9)3设有两个二元总体°』和匕,从中分别抽取样本计算得到和判别规则。
样品X=(6,0)'应属于哪个总体?.貳匚厲.好J") 已酬 4解:门1= ⑴,比= I - 2丿,匚=2叫二打仗-对二仗--肝)i(x - p) = (&D )-(4.0.5) =〔2,0.5)0.5 0.5 2 131 0 0 11 10.50.5E(0.5X 1 X 2 0.5X 31) 2E( 0.5X 1 0.5X 3 2) 1D(0.5X 1 X 2 0.5X 3 1) 3D( 0.5X 10.5X 3 2) 1COV(0.5X 1 X 2 0.5X 3 1, 0.5X 1 0.5X 3 2)1故Y : N 3(E(Y), D(Y))2.设三维随机向量X : N 3(,),已知 5.8 2.121 7.6假设热二血,试用距离判别法建立判别函数-11 I 7.6 -2.1J3967(-2,15 A j即样品X 属于总体G 1利用SPSS 得到的Bayes 判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判 断新样品(x1,x2,x3 )属于哪类?Classification Function Coefficientsgroup12 3 x1 -11.689 -10.707 -2.194 x212.29713.3614.960W =(20 5)-' 24.47.6- 2A-2.15.84设已知有两个正态总体 G 1,G 2,且1:,而其先验概率分别为 q 1 q 20.5,误判的代价 L(2 |1) e 4,L(1|2)试用贝叶斯判别法确定样本X3属于哪个总体?5解:由 Bayes 判别知, W(x)f,x) f 2(x)exp[( x_) 1( 12)]其中.q 2C(1|2) dqQ(2|1)W(x) WX 1 X 2属于 2)G2总体5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据,表1 Bayes判别函数系数解:根据判别分析的结果建立Bayes判别函数:Bayes判别函数的系数见表4.1。
表中每一列表示样本判入相应类的Bayes判别函数系数。
由此可建立判别函数如下:Group1:Y1 81.843 11.689X1 12.297X2 16.761X3Group2:Y2 94.536 10.707X1 13.361X2 17.086X3Group3:Y3 17.449 2.194X1 4.960X2 6.447X3将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。
比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。
6.对某数据资料进行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根和对应的标准正交特征向量为1 2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)1(1) 取公因子个数为2,求因子载荷阵(2) 用F1F2表示选取的公因子,1, 2为特殊因子,写出因子模型,说明因子载荷阵中元素a ij的统计意义7在一项对杨树的形状研究中,测定了20株杨树树叶,每个叶片测定了四个变量X1,X2,X3,X4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:1 2.920 U1 (0.1485, 0.5735, 0.5577, 0.5814)1.024 U2(0.9544, 0.0984,0.2695,0.0824)20.049 U3(0.2516,0.7733, 0.5589, 0.1624)30.007U4(0.0612,0.2519,0.5513, 0.7930)4若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡 献率解:选取主成分的一般原则是特征值大于 1 或累积贡献率达到 80%以上。