诚信应考 考出水平 考出风格浙江大学城市学院2011 — 2012 学年第一学期期末考试卷《 回归分析 》开课单位: 计算分院 ;考试形式:开卷(A4纸一张);考试时间:2011年01月6日; 所需时间: 120 分钟一.计算题(10分。
)1,考虑过原点的线性回归模型1,1,2,...,i i i y x i n βε=+=误差1,...,n εε仍满足基本假定。
求1β的最小二乘估计。
并求出1β的期望和方差,写出1β的分布。
1221111111121,1,2,...,ˆ()()2()0ˆi i i nni i i i i i ni i i i ni ii nii y x i n Q y yy x Qy x x x yxβεββββ======+==-=-∂=--=∂=∑∑∑∑∑解:第1页共 6 页二. 证明题(本大题共2小题,每小题7分,共14分。
)1,证明:(1)22()1var()[1]i i xxx x e n L σ-=--(2)2211ˆˆ()2ni i i y y n σ==--∑是2σ的无偏估计。
011111122ˆˆˆ()()1()()1var()var[()()]()1var()var((()))()12cov[,(())](1(i i i i i nn i i j j jj j xx ni i i j j j xx ni i j j j xx ni i j j j xxe y y y x x x x y y x x y n L x x e y x x y n L x x y x x y n L x x y x x y n L x n ββσσ======-=----=----=-+--=++---+-=++∑∑∑∑∑解(1):222122222221212211)()1())2()()()11(12()]()1[1]1ˆˆ(2)()(())21ˆ[()]2()111var()[1]2212n i i j j xx xxi i xx xxi xx ni i i ni i i n n i i i i xx x x x x x L n L x x x x n L n L x x n L E E y y n E y y n x x e n n n L n σσσσσ=====----+--=++-+-=--=--=---==----=-∑∑∑∑∑22(11)n σσ--=三.填空题.(每空2分,共46分)1.为了研究家庭收入和家庭消费的关系,通过调查得到数据如下:6.22893,29.12349,43008,97.29,5422=====∑∑∑xy yxy x1)用最小二乘估计求出线性回归方程的参数估计值0ˆβ= 。
1ˆβ= 。
2)根据以下的方差分析表求F 统计量== 。
在显著性水平05.0=α 时,检验回归方程是否显著 。
已知 23.5)8,1(05.0=F 。
3) 在显著性水平05.0=α时,检验参数1β 的显著性。
已知306.2)8(05.0=t ,在上表中找出2ˆσ= 。
求得t= 。
是否拒绝假设0:10=βH , 。
4) 在60000 x 元时,0y 的置信水平为0.95的近似预测区间为。
2.为了研究货运总量y (万吨)与工业总产值1x (亿元)、农业总产值2x (亿元)、居民非商品支出3x (亿元)的关系,利用数据做多元回归分析,SPSS 结果如下。
Correlationsyx1 x2 x3 yPearson Correlation 1.556 .731*.724*Sig. (2-tailed).095.016 .018 N1010 10 10 x1 Pearson Correlation .556 1.155 .444 Sig. (2-tailed) .095 .650.171 N10 1111 11 x2 Pearson Correlation .731*.155 1.562 Sig. (2-tailed) .016 .650 .072N10 11 1111 x3 Pearson Correlation .724* .444 .562 1Sig. (2-tailed) .018 .171 .072 N10111111*. Correlation is significant at the 0.05 level (2-tailed).CorrelationsControl Variables x1x2 x3x1Correlation 1.000-.128 Significance (2-tailed) . .724 df0 8 x2Correlation -.128 1.000Significance (2-tailed) .724 . df8CorrelationsControl Variables y x3 x1 & x2 yCorrelation 1.000.433 Significance (2-tailed) . .284 df0 6 x3Correlation .433 1.000Significance (2-tailed) .284 . df6请根据上面的结果回答下面问题:1) y 关于1x ,2x ,3x 的三元线性回归方程__________________________。
2) 标准化回归方程为___________________________。
3) y 与1x 的样本相关系数为____________________________ 。
4) 在X1、X2为控制变量下的y 与X3之间的偏相关系数____________________________ 。
5) 哪一个自变量对y 的影响最大____________________________ 。
6) 哪些回归系数没通过显著性检验______。
7) 应先剔除哪一个自变量后重新建立回归方程_____。
8) y 与321,,xx x 样本决定系数为____________。
9) y 与321,,xx x 样本复相关系数为____________。
10) y 与321,,x x x 调整后的复决定系数为____________。
3.现对某数据进行多重共线性分析,SPSS 分析结果如下:Coefficients aModel Unstandardized CoefficientsStandardizedCoefficientst Sig.Collinearity Statistics B Std. ErrorBetaToleranceVIF1(Constant) 1348.225 2211.467 .610 .552x1 -.641 .167 -1.125 -3.840 .002 .003 319.484 x2 -.317 .204 -1.305 -1.551 .143 .000 2.637E3 x3 -.413 .548 -.270 -.752 .464 .002 479.288 x4 -.002 .024 -.007 -.087 .932 .037 27.177 x5 .671 .128 3.706 5.241 .000 .001 1.861E3 x6-.008.008-.020-.928.369.5741.743a. Dependent Variable: y根据上面结果回答下面的问题:1) 自变量1x 的方差扩大因子为__________________。
2) 自变量6x 的容忍度为________________________。
3) 最大的条件数为_________。
4) 以上结果表明自变量之间是否存在多重共线性______。
5) 从Variance Proportions 判断哪些自变量之间存在多重共线性___ ___4.现收集了x 与y 的20组数据,根据SPSS 的输出结果回答下列问题:1) DW= 。
自相关系数ρ= 。
2) 用DW 检验诊断序列是否存在自相关?( 1.2l d = , 1.4u d =1)。
。
3) 已知用迭代法得到的回归方程为,17.0201.0t t x y '+-='则还原为原始变量的 方程为 。
4) 已知用差分法处理数据后得到的回归方程为ˆ0.166yx ∆=∆,则还原为原始变量 的方程为 。
四.(10分)一位药物学家使用下面的非线性模型对药物反应拟合回归模型:10021i i c i c y c x c ε=-+⎛⎫+ ⎪⎝⎭其中,自变量x 为药剂量,用级别表示;因变量y 为药物反应程度,用百分数表示。
3个参数210,,c c c 都是非负的,根据专业知识,0c 的上限是100%,3个参数的初始值取为8.4,5,100210===c c c 。
根据数据利用SPSS 对其作一元非线性回归。
1),在Model Expression 框中填写回归函数和参数的初值赋值形式。
2) 下面是SPSSParameter EstimatesParameter Estimate Std.Error 95% Confidence Interval Lower BoundUpper Boundc0 99.541 1.567 95.705 103.376 c1 6.761 .422 5.729 7.794 c24.800.0504.6774.922得分五.(10分)在均匀设计方法的试验中,由于试验次数少,因而需要采用回归分析方法对试验结果进行分析进而发现优化的试验条件。
维生素C 注射液因长期放置会渐变成微黄色,中国药典规定可以用焦亚硫酸钠等作为抗氧剂。
本实验考虑3个因素:EDTA (x1),无水碳酸钠(x2),焦亚硫酸钠(x3),每个因素各取7个水平,选用U7(74)均匀设计表,试验响应变量是吸收度(y ),取值越小越好,使用二次多项式回归,试验设计的数据与结果如下表,采用逐步回归,根据SPSS 的输出结果回答下列问题.1)直接看的好条件是什么方案? 。
2) 从第3个回归方程求出最优解是 。
3) 从第4个回归方程求出最优解 。
4) 从第5个回归方程求出最优解 。
5)从回归方程求出的最优解与直接看的好条件是否一致 。
2220112233111222333121213132323y x x x x x x x x x x x x ββββββββββε=++++++++++回归模型:(2)已知经过Logistic变换后的线性回归方程为y=-1.401+0.739x, 则相应的Logistic回归方程;(3)求出有一半人有副作用的剂量水平(保留一位小数)。
3、真真的心,想你;美美的意,恋你;暖暖的怀,抱你;甜甜的笑,给你;痴痴的眼,看你;深深的夜,梦你;满满的情,宠你;久久的我,爱你!4、不管从什么时候开始,重要的是开始以后不要停止;不管在什么时候结束,重要的是结束以后不要后悔。