当前位置:文档之家› Eviews实验课讲义_3一元多元线性回归_上机课

Eviews实验课讲义_3一元多元线性回归_上机课

第三课一元及多元线性回归模型3.1一元线性回归模型一、做两个变量的散点图,从而看两个变量是否具有线性关系。

案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。

操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。

Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。

命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)Estimation Command:LS GDPP STEELP CEstimation Equation:GDPP = C(1)*STEELP + C(2)Substituted Coefficients:GDPP = 93.6876362857*STEELP - 3394.97191614五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的对于案例数据1978年-2008年市城镇居民年家庭收入和年消费性支出数据,进行样本与外的预测。

通过equation窗口中的forecast直接进行样本预测:查看图及workfile中的yf序列;在sample或range中改变样本区间或文件区间(需补充观察值)后进行样本外预测。

对案例数据1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)散点图观察后,显示负相关的直线关系,操作过程同上。

实验作业——一元线性回归建模。

附录:练习数据3.1为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。

由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。

但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。

为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其他因素归并到随机变量u中,建立这两个变量之间的数学模型。

表中给出Y为某市城镇居民人均鲜蛋需求量(公斤),X为年人均可支配收入(元,练习数据3.2:10个家庭收入与消费支出的界面数据。

3.2多元线性回归模型一、做以因变量为横轴,多个自变量为纵轴的散点图,简单观察该因变量与多个自变量之间的关系。

案例数据:中国粮食生产函数。

根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。

下表给出了1983——2000中国粮食生产的相关数据,拟建立中国粮食生产函数。

Wokfile窗口下建立graph对象,注意在序列对话框中首先输入y,再依次输入x1到x5,首先生成系统默认的折线图,通过option改成散点图,观察得到的图形结果,分析可知需要分轴显示或标准化处理,处理前后图形结目的是为了查看哪些变量之间线性相关性比较强,也就是相关系数比较大。

(同时也是为了和散点图及回归方程相互验证。

)建立组对象group1,打开后利用view---group member添加x1----x5所有的序列,选择yes保持改变,再打开组对象,发现所添加序列已经存在;查看其相关系数矩阵;结果如下;三、以建立方程对象的方式来建立多元线性回归模型。

建立方程对象,命名为equation1,输入变量列表(变量过多可提前复制,粘贴即可),确定完成模型建立,结果如下;Coefficient Std. Error t-Statistic Prob.C -12815.75 14078.90 -0.910280 0.3806X1 6.212562 0.740881 8.385373 0.0000X2 0.421380 0.126925 3.319919 0.0061X3 -0.166260 0.059229 -2.807065 0.0158X4 -0.097770 0.067647 -1.445299 0.1740X5 -0.028425 0.202357 -0.140471 0.8906R-squared 0.982798 Mean dependent var 44127.11Adjusted R-squared 0.975630 S.D. dependent var 4409.100S.E. of regression 688.2984 Akaike info criterion 16.16752Sum squared resid 5685056. Schwarz criterion 16.46431Log likelihood -139.5077 Hannan-Quinn criter. 16.20845F-statistic 137.1164 Durbin-Watson stat 1.810512Prob(F-statistic) 0.000000四、对模型结果的解释和评价。

本案例中有明显的多重共线性的现象,从计算结果看,R2较大并接近于1,而且F=137.11>F0.05=3.11,故认为粮食生产量与上述所有解释变量间总体线性相关显著。

但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。

结果说明模型存在共线性,与相关系数矩阵得到了相互验证。

即通过观察可见,F统计量概率为0,说明方程显著;部分t的prob大于5%,说明解释变量间存在共线性;五、我们选取逐步引入法选择变量,同时克服多重共线性。

方法有两种:一个是手动逐个加入自变量;二是采取逐步回归的办法来让计算机自动加入。

1.首先是手动逐步引入,过程如下:(1)分别做粮食生产量对各个解释变量的回归,得A.Y对X1回归结果:Variable Coefficient Std. Error t-Statistic Prob.C 30867.31 1206.364 25.58706 0.0000X1 4.576115 0.398199 11.49202 0.0000R-squared 0.891941 Mean dependent var 44127.11Adjusted R-squared 0.885187 S.D. dependent var 4409.100S.E. of regression 1493.984 Akaike info criterion 17.56072Sum squared resid 35711799 Schwarz criterion 17.65965Log likelihood -156.0465 F-statistic 132.0666Durbin-Watson stat 1.855174 Prob(F-statistic) 0.000000B.Y对X2回归结果:Variable Coefficient Std. Error t-Statistic Prob.C -33822.41 68409.15 -0.494414 0.6277X2 0.698880 0.613273 1.139590 0.2712R-squared 0.075073 Mean dependent var 44127.11Adjusted R-squared 0.017265 S.D. dependent var 4409.100S.E. of regression 4370.873 Akaike info criterion 19.70775Sum squared resid 3.06E+08 Schwarz criterion 19.80668Log likelihood -175.3698 F-statistic 1.298665Durbin-Watson stat 0.118043 Prob(F-statistic) 0.271231C.Y对X3回归结果Variable Coefficient Std. Error t-Statistic Prob.C 35712.86 4926.583 7.249012 0.0000X3 0.349978 0.200802 1.742906 0.1005R-squared 0.159563 Mean dependent var 44127.11Adjusted R-squared 0.107036 S.D. dependent var 4409.100S.E. of regression 4166.457 Akaike info criterion 19.61196Sum squared resid 2.78E+08 Schwarz criterion 19.71089Log likelihood -174.5076 F-statistic 3.037721Durbin-Watson stat 0.935587 Prob(F-statistic) 0.100533D.Y对X4回归结果:Variable Coefficient Std. Error t-Statistic Prob.C 31918.72 1828.715 17.45418 0.0000X4 0.379967 0.054448 6.978587 0.0000R-squared 0.752707 Mean dependent var 44127.11Adjusted R-squared 0.737252 S.D. dependent var 4409.100S.E. of regression 2260.060 Akaike info criterion 18.38861Sum squared resid 81725964 Schwarz criterion 18.48754Log likelihood -163.4975 F-statistic 48.70067Durbin-Watson stat 1.109488 Prob(F-statistic) 0.000003E.Y 对X5回归结果:Variable Coefficient Std. Error t-Statistic Prob.C -28260.02 27240.49 -1.037427 0.3150X5 2.239614 0.842352 2.658762 0.0172R-squared 0.306429 Mean dependent var 44127.11Adjusted R-squared 0.263081 S.D. dependent var 4409.100S.E. of regression 3784.948 Akaike info criterion 19.41989Sum squared resid 2.29E+08 Schwarz criterion 19.51882Log likelihood -172.7790 F-statistic 7.069018Durbin-Watson stat 0.357079 Prob(F-statistic) 0.017160(2)逐步回归,A、Y对X1、X4回归结果:Variable Coefficient Std. Error t-Statistic Prob.C 31164.92 1137.219 27.40451 0.0000X1 6.925938 1.331502 5.201597 0.0001X4 -0.221178 0.120350 -1.837792 0.0860R-squared 0.911800 Mean dependent var 44127.11Adjusted R-squared 0.900040 S.D. dependent var 4409.100S.E. of regression 1394.000 Akaike info criterion 17.46875Sum squared resid 29148555 Schwarz criterion 17.61715Log likelihood -154.2188 F-statistic 77.53409Durbin-Watson stat 1.992572 Prob(F-statistic) 0.000000从回归结果看,拟合优度虽然上升,但X4的系数不显著,因此,存在共线性,而相比较而言,X1更重要,因此剔除X4(从相关分析也有助于这个结论)。

相关主题