当前位置:文档之家› 秋季多元统计分析考试答案

秋季多元统计分析考试答案

《多元统计分析》课程试卷答案A 卷2009年秋季学期开课学院:理考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟班级 姓名 学号散卷作废。

一、(15分)设()∑⎪⎪⎪⎭⎫ ⎝⎛=,~3321μN x x x X ,其中⎪⎪⎪⎭⎫ ⎝⎛-=132μ,⎪⎪⎪⎭⎫ ⎝⎛=∑221231111,1.求32123x x x +-的分布;2. 求二维向量⎪⎪⎭⎫ ⎝⎛=21a a a ,使3x 与⎪⎪⎭⎫⎝⎛'-213x x a x 相互独立。

解:1.32123x x x +-()CX x x x ∆⎪⎪⎪⎭⎫⎝⎛-=321123,则()C C C N CX '∑,~μ。

(2分)其中:μC ()13132123=⎪⎪⎪⎭⎫ ⎝⎛--=,()9123221231111123=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛-='∑C C 。

(4分)所以32123x x x +-()9,13~N (1分)2. ⎪⎪⎪⎭⎫⎝⎛⎪⎪⎭⎫ ⎝⎛'-2133x x a x x =AX x x x a a ∆⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛--32121110,则()A A A N AX '∑,~2μ。

(1分)其中:订线装μA ⎪⎪⎭⎫⎝⎛++-=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛--=132113*********a a a a,(1分) ⎪⎪⎭⎫⎝⎛+--+++--+--='⎪⎪⎭⎫ ⎝⎛--⎪⎪⎪⎭⎫⎝⎛⎪⎪⎭⎫ ⎝⎛--='∑2422322222110022123111111002121222121212121a a a a a a a a a a a a a a A A (2分)要使3x 与⎪⎪⎭⎫⎝⎛'-213x x a x 相互独立,必须02221=+--a a ,即2221=+a a 。

因为2221=+a a 时2422321212221+--++a a a a a a 0>。

所以使3x 与⎪⎪⎭⎫ ⎝⎛'-213x x a x 相互独立,只要⎪⎪⎭⎫ ⎝⎛=21a a a 中的21,a a 满足2221=+a a 。

(4分)二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为⎪⎪⎪⎭⎫⎝⎛=3861096X ,给定显著性水平05.0=α,1. 求均值向量μ和协方差矩阵∑的无偏估计2. 试检验,38:H 0⎪⎪⎭⎫ ⎝⎛=μ .38:H 1⎪⎪⎭⎫⎝⎛≠μ (已知F 分布的上α分位数为19)2,2(F ,5.199)1,2(F ,51.18)2,1(F 0.050.050.05===)解:1、⎪⎪⎭⎫ ⎝⎛==∑=68X n 1X n1i i (3分) ⎪⎪⎭⎫ ⎝⎛--='--=∑=9334)X X ()X X (1-n 1S i n1i i (3分) 2、,38:H 0⎪⎪⎭⎫ ⎝⎛=μ .38:H 1⎪⎪⎭⎫⎝⎛≠μ…(1分)在原假设成立的条件下,检验统计量为:)38X ()n /S ()38X (T 12⎪⎪⎭⎫ ⎝⎛-'⎪⎪⎭⎫ ⎝⎛-=- (3分) 由⎪⎪⎭⎫ ⎝⎛==∑=68X n 1X n 1i i ,)9334()X X ()X X (1-n 1S i n1i i --='--=∑= 4)3868()3/93-34()3868(T 12=⎪⎪⎭⎫⎝⎛-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-'⎪⎪⎭⎫⎝⎛-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=-…………………………(2分) 5.199)1,2(F 1T p)1n (p n F 05.02=<=--=……………………………….(1分)所以接受原假设。

(1分)三、 (20分)据国家和地区的女子田径纪录数据,数据如下表:基于相关矩阵对上述数据进行因子分析,利用SPSS 软件所得部分运算结果如下:求:1. 写出正交因子模型;2. 给出表3.3中Bartlett's Test of Sphericity的原假设和备择假设,对此结果做出解释;3. 根据上述运算结果,试填写下表并对两个旋转因子的含义做出解释; 4. 解释共同度及累计贡献率的含义; 5. 写出两个旋转因子的因子得分表达式。

解:1.(5分)2.p p I H I H ≠=ρρ:,:10,由P 值05.0<,所以拒绝原假设,即相关矩阵不是单位矩阵。

(2分)3.(7分)εμ+Λ+=f X ()()()()⎪⎪⎩⎪⎪⎨⎧=ψ====⨯221,,,0)(E 0,CO 0p p k k diag f V If D f E ψψεεε 的协方差阵令: ⎪⎪⎪⎭⎫ ⎝⎛=p x x X 1⎪⎪⎪⎭⎫ ⎝⎛=p μμμ 1⎪⎪⎪⎭⎫ ⎝⎛=k f f f 1⎪⎪⎪⎭⎫ ⎝⎛=p εεε 1()k p ij ⨯=Λλ—特殊因子—因子载荷矩阵*1f 表示长跑耐力因子,*2f 表示短跑速度因子。

4. 共同度表示提取的前k 个公因子反映第i 个原始变量的信息程度。

累计贡献率表示提取的前k 个公因子对所有原始变量的解释程度。

(2分)5.42954.302533.173X 417.082434.04476.9X 406.033243.03255.4X 417.010822.00764.2X 247.067834.24058.53X 084.011106.16416.23X 328.045221.06185.11X 288.0f 7654321*1-+-+-+-+------=42954.302533.173X 240.082434.04476.9X 214.033243.03255.4X 226.010822.00764.2X 038.067834.24058.53X 333.011106.16416.23X 597.045221.06185.11X 555.0f 7654321*2---------+-+-=(4分)四、(20分)文件Poverty.sav 是美国1960-1970年随机选择的30个城市的人口调查结果,其中Y 表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。

利用spss 进行多元线性回归分析,结果如下:求:1. 解释表4.2中“R ” ,“R Square ” 及“Adjusted R Square ”的含义; 2. 写出表4.3 Model 2所检验的原假设和备择假设,当显著性水平05.0=α时,给出检验的结论;3. 给定检验的显著性水平05.0=α,多元线性回归方程的回归系数t 检验是否显著,解释原因;4. 当X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时,写出y 的预 测值;5. 解释表4.4 中偏相关系数的含义,并对Model 2 中偏相关系数的结果进行解释。

解:1. R 的线性关系的大小。

与为一个整体的为复相关系数,衡量作Y X X X p ,,21 R Square 称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。

总离差平方和回归平方和===SST SSR R Square R 2。

Adjusted R Square 为)1()1(12----=n SST p n SSE R a ,与R Square 一起反映回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。

(4分) 2.令21ββ,分别表示自变量41,X X 对应的的回归系数的表4.3 Model 2所检验的原假设和备择假设为中至少有一个不为零,211210,:0:ββββH VS H ==。

由于检验的05.00=<=α值p ,因此,拒绝原假设0H ,即认为回归方程线性显著。

(4分)3. 1X 对Y 的线性影响显著,因为t 检验的05.0001.0=<=α值p ;4X 对Y 的线性影响显著,因为t 检验的05.0000.0=<=α值p 。

(4分)4. 多元线性回归方程为:41366.027.0496.52ˆX X Y --=,X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时523.2274366.07.1027.0496.52ˆ=⨯-⨯-=Y 。

(4分)5.偏相关系数指其它变量都在模型里时,所研究自变量对因变量的影响。

X1在模型时,X4与Y 的偏相关系数是-.693,对Y 的影响是负影响。

X4在模型时,X1与Y 的偏相关系数是-.591,对Y 的影响是负影响。

二者对Y 的影响程度大致相当。

(4分) 五、(15分)五个样品间的距离矩阵如下⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛0611141805812037040543215 43 2 1试用最短距离法对样品进行聚类。

画出聚类图,并给出聚为两类时的结果。

解:解:(1)距离矩阵为 (2)将2和3合并成6G ,重新计算4类之间的距离⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛0611141805812037040543215 43 2 1 (3分)(3分)(2分)(3分) 聚为两类时的结果}4,3,2,1{,}5{ (4分)六、(16分)对破产企业收集他们在破产前两年的年度数据,对财务良好企业也收集同一时期的数据。

数据涉及四个变量,=1x 现金流量/总债务,=2x 净收入/总资产,=3x 流动资产/流动债务,=4x 流动资产/净销售额。

数据列于表6.1 表6.1 企业财务数据(3)将1和6G 合并成7G ,计算3类之间的距离(4)将4和7G 合并成8G ,计算2类之间的距离 (5)画聚类图 6G 7G 9G 5G 4G 3G 2G 1G 8G表6.6 Standardized Canonical 表6.7 UnstandardizedDiscriminant Function Coefficients Canonical Discriminant FunctionCoefficients表6.8 Classification Function1. 指出表6.3的作用,并对表6.3的结果做评价;2. 写出Fisher 判别法的线性判别函数f 的表达式;3. 假定某企业的财务数据08.01=x ,02.02=x ,01.23=x ,53.04=x ,那么,该企业是否面临破产?(分别用Fisher 判别法和Bayes 判别法给出判别结果);4. 根据表6.9的输出结果,你对本题中的判别方法有何评价?解:1. 表6.3的作用是检验两组的均值是否相等。

相关主题