第三课一元及多元线性回归模型一元线性回归模型一、做两个变量的散点图,从而看两个变量是否具有线性关系。
案例数据:1985-2002年我国人均钢产量与人均GDP的时间序列数据(数据3_1_1)。
操作方法:通过序列组的形式右键单击打开后,在group窗口下view——graph---scatter,通过对散点图结同样的操作可以检验其它案例数据(3_1_2和3_1_3)的特征:案例数据2、3、4、5:10个家庭人均收入与消费支出的横截面数据;1978-2000年中国人均消费模型;1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据(case1_1的数据); 1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)(其中,零售价格是已经经过物价调整的)二、通过建立方程对象的方式来估计一个方程,并保存我们建立的方程对象。
Workfile窗口下建立新的对象---equation对象并命名,在equation estimation 窗口下的specification 选项卡下的equation specification对话框中设置因变量、自变量及常数项,在estimation settings对话框中注意:建模途径:command: quick\estimation equation回车,或object\equation object,设置。
命令行形式:(1)列表法:consp c gdpp 或(2)公式法:consp=c(1)+c(2)*gdpp三、方程估计结果的解释、评价及模型检验(拟合优度评价,估计参数和方程的显著性检验)消费方程中,C为自发性消费,x(gdpp)的系数为经济参数,关注其意义;通过拟合优度、调整后的拟合优度、t统计量后的精确显著性水平p(相伴概率);f统计量的p来判断对原假设接受与否四、在回归估计结果中显示方程的三种形式(即估计命令,回归方程的一般表达式,带有系数估计值的表达式)Estimation Command:LS GDPP STEELP CEstimation Equation:GDPP = C(1)*STEELP + C(2)Substituted Coefficients:GDPP = *STEELP - 3394.五、如何查看因变量的实际值、拟合值和回归方程的残差(包括表的形式和图的形式)通过方程窗口下的view去实现实际值、拟合值和回归方程的残差;单独显示残差及标准化后的对于案例数据1978年-2008年北京市城镇居民年家庭收入和年消费性支出数据,进行样本内与外的预测。
通过equation窗口中的forecast直接进行样本内预测:查看图及workfile中的yf序列;在sample或range中改变样本区间或文件区间(需补充观察值)后进行样本外预测。
对案例数据1970年-1980年美国的咖啡平均真实零售价格(每磅美元)与消费量(每人每日杯数)散点图观察后,显示负相关的直线关系,操作过程同上。
实验作业——一元线性回归建模。
附录:练习数据为了研究某市城镇每年鲜蛋的需求量,首先考察消费者年人均可支配收入对年人均鲜蛋需求量的影响。
由经济理论知,当人均可支配收入提高时,鲜蛋需求量也相应增加。
但是,鲜蛋需求量除受消费者可支配收入影响外,还要受到其自身价格、人们的消费习惯及其他一些随机因素的影响。
为了表示鲜蛋需求量与消费者可支配收入之间非确定的依赖关系,我们将影响鲜蛋需求量的其他因素归并到随机变量u中,建立这两个变量之间的数学模型。
表中给出Y为某市城镇居民人均鲜蛋需求量(公斤),X为年人均可支配收入(元,练习数据:10个家庭收入与消费支出的界面数据。
多元线性回归模型一、做以因变量为横轴,多个自变量为纵轴的散点图,简单观察该因变量与多个自变量之间的关系。
案例数据:中国粮食生产函数。
根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。
下表给出了1983——2000中国粮食生产的相关数据,拟建立中国粮食生产函数。
Wokfile窗口下建立graph对象,注意在序列对话框中首先输入y,再依次输入x1到x5,首先生成系统默认的折线图,通过option改成散点图,观察得到的图形结果,分析可知需要分轴显示或标准化处理,处理前后图形结果如下;相关系数比较大。
(同时也是为了和散点图及回归方程相互验证。
)建立组对象group1,打开后利用view---group member添加x1----x5所有的序列,选择yes保持改变,再打开组对象,发现所添加序列已经存在;查看其相关系数矩阵;结果如下;三、以建立方程对象的方式来建立多元线性回归模型。
建立方程对象,命名为equation1,输入变量列表(变量过多可提前复制,粘贴即可),确定完成模型建立,结果如下;Coefficient Std. Error t-Statistic Prob.CX1X2X3X4X5R-squared Mean dependent varAdjusted R-squared. dependent var. of regression Akaike info criterionSum squared resid5685056.Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)四、对模型结果的解释和评价。
本案例中有明显的多重共线性的现象,从计算结果看,R2较大并接近于1,而且F=>=,故认为粮食生产量与上述所有解释变量间总体线性相关显著。
但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。
结果说明模型存在共线性,与相关系数矩阵得到了相互验证。
即通过观察可见,F统计量概率为0,说明方程显著;部分t的prob大于5%,说明解释变量间存在共线性;五、我们选取逐步引入法选择变量,同时克服多重共线性。
方法有两种:一个是手动逐个加入自变量;二是采取逐步回归的办法来让计算机自动加入。
1.首先是手动逐步引入,过程如下:(1)分别做粮食生产量对各个解释变量的回归,得A.Y对X1回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X1R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )对X2回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X2R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid+08Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )对X3回归结果Variable Coefficient Std. Error t-Statistic Prob.C X3R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid+08Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )对X4回归结果:Variable Coefficient Std. Error t-Statistic Prob.CX4R-squared Mean dependent var Adjusted R-squared. dependent var . of regression Akaike infocriterionSum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic)对X5回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X5R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid+08Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )(2)逐步回归,A、Y对X1、X4回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X1 X4R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )从回归结果看,拟合优度虽然上升,但X4的系数不显著,因此,存在共线性,而相比较而言,X1更重要,因此剔除X4(从相关分析也有助于这个结论)。
B、Y对X1、X5回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X1 X5R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )拟合优度升高不显著,修正的拟合优度略微下降,且X5系数不显著,因此,剔除X5.C、Y对X1、X3回归结果:Variable Coefficient Std. Error t-Statistic Prob.C X1 X3R-squaredMean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterion Log likelihood F-statisticDurbin-Watson statProb(F-statistic )从回归结果看,拟合优度提高,X1和X3的系数显著,因此接受X3.D、Y对X1、X2、X3回归结果:从回归结果看,拟合优度提高,X1、X2和X3的系数显著,因此接受X2.即,回归方程为: Y = + *X1 + *X2 - *X32.计算机自动逐步回归Equation 对象设置时,选择最后逐步回归法(step wise ),同时,第一个框中输入因变量和必须包含的自变量,当前输入y 和c ;第二个框输入所有解释变量,让eviews 自己去选择,再点击option 选项卡,选择向前还是向后回归,先前及逐步加入回归,向后即先将所有变量都放进去,再删除,本例中选择,forward 确定后,观察结果,与手动结果一样;五、多元回归建模————多元回归模型估计、检验及预测案例数据:我国1988年-1998年的城镇居民人均全年耐用消费品支出、人均全年可支配收入以及耐用消费品价格指数的统计资料如下表,试建立城镇居民人均全年耐用消费品支出Y 关于人均全年可支配收入x1和耐用消费品价格指数X2的回归模型,并进行回归分析。