一元线性回归模型案例分析一、研究的目的要求居民消费在社会经济的持续发展中有着重要的作用。
居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。
改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。
但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。
例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。
为了研究全国居民消费水平及其变动的原因,需要作具体的分析。
影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。
为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。
二、模型设定我们研究的对象是各地区居民消费的差异。
居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。
而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。
所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。
因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。
因此建立的是2002年截面数据模型。
影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。
因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。
为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。
从2002年《中国统计年鉴》中得到表2.5的数据:表2.52002年中国各地区城市居民人均年消费支出和可支配收入如图2.12:图2.12从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立的计量经济模型为如下线性模型:12i i i Y X u ββ=++ 三、估计参数假定所建模型及随机扰动项i u 满足古典假定,可以用OLS 法估计其参数。
运用计算机软件EViews 作计量经济分析十分方便。
利用EViews 作简单线性回归分析的步骤如下: 1、建立工作文件首先,双击EViews 图标,进入EViews 主页。
在菜单一次点击File\New\Workfile ,出现对话框“Workfile Range ”。
在“Workfile frequency ”中选择数据频率:Annual (年度) Weekly ( 周数据 )Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 ) Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 ) Monthly (月度) Undated or irreqular (未注明日期或不规则的) 在本例中是截面数据,选择“Undated or irreqular ”。
并在“Start date ”中输入开始时间或顺序号,如“1”在“end date ”中输入最后时间或顺序号,如“31”点击“ok ”出现“Workfile UNTITLED ”工作框。
其中已有变量:“c ”—截距项 “resid ”—剩余项。
在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。
若要将工作文件存盘,点击窗口上方“Save ”,在“SaveAs ”对话框中给定路径和文件名,再点击“ok ”,文件即被保存。
4000600080001000012000400060008000100001200014000XY2、输入数据在数据编辑窗口中,首先按上行键“↑”,这时对应的“obs”字样的空格会自动上跳,在对应列的第二个“obs”有边框的空格键入变量名,如“Y ”,再按下行键“↓”,对因变量名下的列出现“NA ”字样,即可依顺序输入响应的数据。
其他变量的数据也可用类似方法输入。
也可以在EViews 命令框直接键入“data X Y ”(一元时) 或 “data Y 1X 2X … ”(多元时),回车出现“Group”窗口数据编辑框,在对应的Y 、X 下输入数据。
若要对数据存盘,点击 “fire/Save As”,出现“Save As ”对话框,在“Drives ”点所要存的盘,在“Directories ”点存入的路径(文件名),在“Fire Name ”对所存文件命名,或点已存的文件名,再点“ok ”。
若要读取已存盘数据,点击“fire/Open”,在对话框的“Drives”点所存的磁盘名,在“Directories”点文件路径,在“Fire Name”点文件名,点击“ok”即可。
3、估计参数方法一:在EViews 主页界面点击“Quick ”菜单,点击“Estimate Equation ”,出现“Equation specification ”对话框,选OLS 估计,即选击“Least Squares”,键入“Y C X ”,点“ok ”或按回车,即出现如表2.6那样的回归结果。
表2.6在本例中,参数估计的结果为:^282.24340.758511i i Y X =+ (287.2649) (0.036928) t=(0.982520) (20.54026)20.935685r = F=421.9023 df=29方法二:在EViews 命令框中直接键入“LS Y C X ”,按回车,即出现回归结果。
若要显示回归结果的图形,在“Equation ”框中,点击“Resids ”,即出现剩余项(Residual )、实际值(Actual )、拟合值(Fitted )的图形,如图2.13所示。
图2.13四、模型检验1、经济意义检验所估计的参数^20.758511β=,说明城市居民人均年可支配收入每相差1元,可导致居民消费支出相差0.758511元。
这与经济学中边际消费倾向的意义相符。
2、拟合优度和统计检验用EViews 得出回归模型参数估计结果的同时,已经给出了用于模型检验的相关数据。
拟合优度的度量:由表2.6中可以看出,本例中可决系数为0.935685,说明所建模型整体上对样本数据拟合较好,即解释变量“城市居民人均年可支配收入”对被解释变量“城市居民人均年消费支出”的绝大部分差异作出了解释。
对回归系数的t 检验:针对01:0H β=和02:0H β=,由表2.6中还可以看出,估计的回归系数^1β的标准误差和t 值分别为:^1()287.2649SE β=,^1()0.982520t β=;^2β的标准误差和t 值分别为:^2()0.036928SE β=,^2()20.54026t β=。
取0.05α=,查t 分布表得自由度为231229n -=-=的临界值0.025(29) 2.045t =。
因为^10.025()0.982520(29) 2.045t t β=<=,所以不能拒绝01:0H β=;因为^20.025()20.54026(29) 2.045t t β=>=,所以应拒绝02:0H β=。
这表明,城市人均年可支配收入对人均年消费支出有显著影响。
五、回归预测由表2.5中可看出,2002年中国西部地区城市居民人均年可支配收入除了西藏外均在8000以下,人均消费支出也都在7000元以下。
在西部大开发的推动下,如果西部地区的城市居民人均年可支配收入第一步争取达到1000美元(按现有汇率即人民币8270元),第二步再争取达到1500美元(即人民币12405元),利用所估计的模型可预测这时城市居民可能达到的人均年消费支出水平。
可以注意到,这里的预测是利用截面数据模型对被解释变量在不同空间状况的空间预测。
用EViews 作回归预测,首先在“Workfile ”窗口点击“Range ”,出现“Change Workfile Range ”窗口,将“End data”由“31”改为“33”,点“OK ”,将“Workfile ”中的“Range ”扩展为1—33。
在“Workfile ”窗口点击“sampl”,将“sampl”窗口中的“1 31”改为“1 33”,点“OK ”,将样本区也改为1—33。
为了输入18270f X =,212405f X =在EViews 命令框键入data x /回车, 在X 数据表中的“32”位置输入“8270”,在“33”的位置输入“12405”,将数据表最小化。
然后在“E quation ”框中,点击“Forecast ”,得对话框。
在对话框中的“Forecast name ”(预测值序列名)键入“fY ”, 回车即得到模型估计值及标准误差的图形。
双击“Workfile ”窗口中出现的“Yf ”,在“Yf ”数据表中的“32”位置出现预测值16555.132f Y =,在“33”位置出现29691.577f Y =。
这是当18270f X =和212405f X =时人均消费支出的点预测值。
为了作区间预测,在X 和Y 的数据表中,点击“View”选“Descriptive Stats\Cmmon Sample”,则得到X 和Y 的描述统计结果,见表2.7: 表2.7根据表2.7的数据可计算:2221()(1)2042.68230125176492.59niX i XX n σ=-=-=⨯=∑221()(82707515.026)569985.74f X X -=-=222()(124057515.026)23911845.72f X X -=-=fY 置信度95%的预测区间为:2221()11()f fni i X X Y t nX X ασ=-++-∑ 18270f X =时1569985.746555.13 2.045413.1593131125176492.59⨯⨯++6555.13860.32=212405f X =时123911845.729691.58 2.045413.1593131125176492.59⨯⨯++9691.58934.49=即是说,当第一步18270f X =时,1f Y 个别值置信度95%的预测区间为(5694.81,7415.45)元。