多元统计分析模拟试题(两套:每套含填空、判断各二十道)A 卷 判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步 判另0法 Q 型聚类分析是对样品的分类,R 型聚类分析是对变量」i 勺分类。
主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。
因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极 大似然法 聚类分析包括系统聚类法、模糊聚类分析、K •均值聚类分析 分组数据的Logistic 回归存在 异方差性,需要采用加权最小二乘估计 误差项的路径系数可山多元回归的决定系数算岀,他们之间的关系为主成分分析是利用軽的思想,在损失很少的信息前提下,把多个指标转化 为儿个综合指标的多元统计方法。
在进行主成分分析时,我们认为所取的m (m<p,p 为所有的主成分)个主成 分的累积贡献率达到85%以上比较合适。
聚类分析的L1的在于使类内对象的同质性最大化和类间对象的异质性最大 化 yi 是随机变量,并且有y 「N (0,l ),那么yf 服从(卡方)分布。
在对数线性模型中,要先将概率取对数,再分解处理,公式: 他 z lllPii z hlRi ±1H£J ± 坦豈丄i ± _ 将每个原始变量分解为两部分因素,一部分是III 所有变量共同具有的少数儿 个 公共因子 组成的,另一部分是每个变量独自具有的因素,即 特殊因 子 判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一 个以上,解释变量必须是可测量的 半被解释变量是属性变量而解释变量是度量变量时判别分桩是合适的统汁 分析方法 多元正态分布是一元正态分布的推广 多元分析的主要理论都是建立在多元正态总体丿表础上的,多元正态分布是多 元分析的基础 因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分 表示成各变量的线性组合。
统讣距离包括欧氏距离和马氏距离两类 1)2)3)4)5)6)7)8)9)10J11)12)13)14)15)16)17)18)19)20)22)最短距离法适用于逑的类, 最长距离法适用于殖1)因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相关程度。
(V)(P147)2)主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法。
(X )(p24)3)判别分析其被解释变量为属性变量,解释变量是度量变量。
(J)(p90)4)Logistic回归对于自变量有要求,度量变量或者非度量变量都不可以进行回归。
(X)(p220)5)在系统聚类过程中,聚合系数越大,合并的两类差异越小。
(X)(P59)6)spss只能对单变量进行正态性检验。
(J )7)Logistic回归中的估计参数(bo, bi,b:, ... ,bn)反应优势比率的变化,如果bi是正的,它的反对数值(指数)一定小于1。
(228)8)密度函数可以是负的。
(X)(p3)9)Y珂计算典型函数推导的典型权重有较小的不稳定性。
(X )(p205)11)10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出具体的统计•量来度量这种相关关系,使研究者在作用对应分析时得到主观性较强的结论。
(X)(pl79)12)多元检验具有概括和全面考察的特点,容易发现各指标之间的关系和差异。
(X)p2513)名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关系。
(X )p4314)k-均值法是一种非谱系聚类法(V)p4415)一般而言,不同聚类方法的结果不完全相同(V)p616)判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的(V)p9017)非谱系聚类法是把变量聚集成k个类的集合。
(X)p6418)主成分的数目大大少于原始变量的数目。
(V)pll419)因子分析只能用于研究变量之间的相关关系。
(X)pl4320)%纠聚类分析中的分类方法中,系统聚类法和分解法相似(相反)。
(X )P4322)聚类分析的U的就是把相似的研究对象归类。
(V)P42B卷填空丿1. 因子分析中因子载荷系数舫的统计意义是第i个变量与第j个公因子的相关系数;(P|46)2. 类平均法的两种形式为组间联结法和组内联结法(P56)3. 设兀〜兀35 = 12・・,10.则呼= g(x厂〃)~吃(10, Z)倍)4. 聚类分析根据实际的需要可能有两个方向,一是对样品,一是对担标聚类。
(P43)5. 模糊聚类分析方法中对原始数据进行变换,变换方法通常有标准化变换,极差变换,对数变换(p63)(1 P 6. 设X ~ N(//,工),其中X = (x , x ), “ =(“,“),工=b IV 1 则Cov(x + x ,x - x )=07. 非谱系聚类法是把样品聚集成K个类的集合。
(P64)8. 因子分析的基木思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较髙,而不同组间的相关性较低。
(P142)9 .两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形。
(P25)10. 因子旋转分为止交旋转和斜交旋转。
(P150)11. Q型聚类是指对样品进行聚类,R型聚类是指对指标(变量)进行聚类。
(42页)12. —元回归的数学模型是:丫二BO+BI X+E ,多元回归的数学模型是:v 二 B 0+ B lx 1+ B 2x 2+ B p x p + £。
13. 变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度.(43 页)14. 判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher判别法、Bayes判别法、逐步判别法。
(80页)15若人〜W"庄)。
,工>0,,且Ai和A2相互独立,。
(19 页)16. 对应分析是将R型因子分析和Q型因子分析结合起来进行的统计分析方法。
(270页)• ••17. 典型相关分析是研究两组变量之间相关分析的一种多元统计方法。
(294页)18. 判别分析适用于被解释变量是韭度量变量的情形。
19. 主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。
(213页)20.设兀,,=1,2・..,16是来自多元正态总体N,”(“◎),产和A分别为正态总体N冲、"的样本均值和样本离差阵,则T2 = 15[4(乂-“)]右[4(乂-“)] ~ 尸(15,P)或占丄尸®』-p).二、判断丿1、对于任何随机向量X=(X,, X2,..…X p)来说,其协方差阵Y都是对称阵,同时总是非负定的。
(T)P52、能够体现各个变量在变差大小上的不同,以及有时存在的相关性还要求距离与各变量所用的单位无关,这种距离是欧式距离。
(F)P73、最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止。
(F )P554、当总体G用G?为正态总体且协方差相等时,选用马氏距离o(T)P905、进行主成分分析的目的之一是减少变量的个数,所以一般不会去p个主成分,而是取m(m<p)个主成分。
(T)P1296、第k个主成分丫*与原始变量X,的相关系数。
(Y k, X,)称为因子负荷量。
(TJP1207、F=(F P F,,……,F m) (m<p)是不可观测的变量,其均值向量E (F)二0,协方差矩阵cov(F)二I,即向量F的各分量不是相互独立的。
(F)P1458、每个典型函数都包括-一对变量,通常一个代表自变量,另一个代表因变量。
(T)P2029、分组数据的Logistic回归不仅适用于大样本的分组数据,对小样木的未分组数据也适用。
(F)P23210、一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达,就称这个为参数可识别。
(T)P26411>随机向量的协方差阵一定是对称的半正定阵。
(T)P512、标准化随机变量的协方差阵与原变量的相关系数相同。
(T )P513、对应分析反应的是列变量与行变量的交叉关系。
(F ) P17014、若一个随机向量的任何边缘分布均为正态,则它是多元正态分布。
(T)plO15、特征函数描述空间的元素之间是否有关联,而隶属度描述了元素之间的关联是多少。
(T)p6216、非谱系聚类法是把变量聚集成K个类的集合。
(F ) p6417、在对因素A和因素B进行对应分析之前没有必要进行独立性检验。
(T ) pl7318、系统聚类法中的“离差平方和法”的基木思想来源于如果类分得正确,同类样品的离差平方和应该较小,类与类之间的离差平方和应该较大。
(T)p5719、距离判别法对总体的分布没有特定的要求。
(T)p9020. Wilks统计量可以化成T2统计量但是化不成F统计量。
(F )pl8。