城乡居民消费水平研究—解决多重共线性一、文献综述长期以来,我国处于商品短缺的困扰之中,不得不采用配给制的办法限制居民的消费选择自由;随着供求关系的变化,人们的消费取向正在发生根本改变。
因此,了解目前城乡居民的消费水平以及其影响因素对于把握国内不同群体消费需求的变化,指导生产、引导消费、开拓市场、发展循环经济、建立和谐社会具有重要意义。
影响消费的因素很多,如价格水平、利率水平、收入水平、消费偏好、家庭财产、风俗习惯、制度模式等。
其中,收入是影响消费的最重要因素。
改革开放以来,我国居民的收入水平在不断提高,居民消费情况也有明显变化。
在居民总体收入逐渐增加的同时,居民的收入差距也有所扩大,形成了高、中、低不同阶层的收入与消费群体。
根据国家统计局的调查资料显示,不同消费群体之间的消费与投资倾向已有很大差异,受此影响,社会消费结构也已发生了较大变化。
如今生活宽裕的高收入居民,十分关注生活质量的提高,消费倾向也出现明显变化,投资意识日益高涨。
调查显示,越来越多的高收入居民,在消费时追求精神消费和服务消费,教育、文化、通信、保健、住宅等成为消费热点,追求时尚化与个性化日趋明显。
高收入家庭的投资是社会民间投资中极为重要的部分,在国民经济运行中的作用不可低估. 中等收入群体占到城镇家庭总数的60%以上,收入占到居民收入总数的50%多,是我国消费的主体部分,他们的消费行为对我国整体消费状况的影响是最大的,对这一层次居民消费的启动将直接关系到我国经济启动的成败。
这一消费群体的消费特征表现为对未来收入与支出不良预期的影响.所以基于这个问题的重要性,决定研究城乡居民的消费水平及其影响因素。
二、数据资料初步分析数据的收集来源于2009年中华人民共和国国家统计局公布的年度数据,并选取城乡居民消费水平、城乡居民家庭人均可支配收入、职工平均工资、人均国内生产总值、城乡居民消费价格指数、城乡新建住房面积来研究其对城镇居民消费水平的影响。
通过初步的线性回归发行这些数据都能较好的解释城镇居民消费水平。
由于财富数据较难取得,所以用城乡新建住房面积来表示这一指标,并且取得较好的效果。
所以将以上6个指标定位解释变量。
其中城乡居民家庭人收入为城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之和。
三、模型估计1.建立模型以我国城乡居民消费水平为被解释变量,同时引入的解释变量有城乡居民储蓄水平(X1 )、城乡居民家庭人收入(X2)、职工平均工资(X3)、人均国内生产总值(X4)、城乡居民消费价格指数(X5)、城乡新建住房面积(X6)。
假定可以建立线性回归模型:0112233445566i Y X X X X X X u βββββββ=+++++++2.参数估计(1)线性回归reg Y X1 X2 X3 X4 X5 X6Source | SS df MS Number of obs = 19 -------------+------------------------------ F( 5, 13) = 944.21 Model | 77476930.1 5 15495386 Prob > F = 0.0000 Residual | 213341.649 13 16410.8961 R-squared = 0.9973 -------------+------------------------------ Adj R-squared = 0.9962 Total | 77690271.8 18 4316126.21 Root MSE = 128.11 ------------------------------------------------------------------------------ Y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- X1 | (dropped)X2 | .0126153 .0076018 1.66 0.121 -.0038074 .0290379 X3 | -.0753099 .0846359 -0.89 0.390 -.2581546 .1075347 X4 | .2648252 .0922938 2.87 0.013 .0654365 .4642138 X5 | 5.839503 6.948697 0.84 0.416 -9.172243 20.85125 X6 | 171.0912 35.59985 4.81 0.000 94.18236 247.9999 _cons | -1529.382 947.0876 -1.61 0.130 -3575.44 516.6768进行线性回归分析发现,变量X1被去掉,变量X3的系数为负,与其经济意义不符,所以模型中可能存在多重共线性。
(2)相关系数检验corr X1 X2 X3 X4 X5 X6(obs=19)| X1 X2 X3 X4 X5 X6-------------+------------------------------------------------------X1 | 1.0000X2 | 1.0000 1.0000X3 | 0.9972 0.9972 1.0000X4 | 0.9942 0.9942 0.9973 1.0000X5 | -0.3218 -0.3218 -0.2860 -0.2773 1.0000X6 | 0.8177 0.8177 0.8110 0.8308 -0.5101 1.0000从相关系数表可以明显看出,所选的变量中X1、X2、X3之间的相关性很大,所以变量间存在多重共线性。
(3)利用差分法,避免多重共线性reg ccY ccX1 ccX2 ccX3 ccX4 ccX5 ccX6Source | SS df MS Number of obs = 18-------------+------------------------------ F( 5, 12) = 63.56Model | 1226305.99 5 245261.198 Prob > F = 0.0000Residual | 46306.008 12 3858.834 R-squared = 0.9636-------------+------------------------------ Adj R-squared = 0.9485Total | 1272612 17 74859.5294 Root MSE = 62.12------------------------------------------------------------------------------ccY | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------ccX1 | .0043066 .0027184 1.58 0.139 -.0016162 .0102293ccX2 | (dropped)ccX3 | -.1018922 .0538593 -1.89 0.083 -.2192416 .0154571ccX4 | .3640821 .0589574 6.18 0.000 .2356249 .4925393ccX5 | -1.19084 3.612622 -0.33 0.747 -9.062068 6.680388ccX6 | 43.98945 18.90781 2.33 0.038 2.792866 85.18604_cons | 67.7396 24.71365 2.74 0.018 13.89319 121.586 虽然F值有明显的减少,但是拟合优度降低了,而且各解释变量的t值较小,所以采用差分法进行修正的效果不明显。
(4)采用逐步回归法进行多重共线性的检验,并对模型进行修正一元回归结果变量X1 X2 X3 X4 X5 X6参数估计值0.0331314 0.033129 0.258607 0.346456 -99.9857 820.765 t统计量26.7 26.7 26.61 36.58 -1.41 7.6 R-squared 0.9767 0.9767 0.9765 0.9875 0.105 0.7726 Adj R-squared 0.9753 0.9753 0.9752 0.9867 0.0523 0.7592 通过一元回归结果看出,解释变量X4的效果做好,所以在X4的基础上进行逐步回归分析。
第一步:在解释变量X4的基础上分别加入新变量,回归结果如下:加入新变量的回归结果变量R-squared Adj R-squaredY X4 0.9875 0.9867Y X4 X1 0.9875 0.9859Y X4 X2 0.9875 0.9859Y X4 X3 0.9889 0.9875Y X4 X5 0.99 0.9887Y X4 X6 0.9967 0.9962第二步:在解释变量X4与X6的基础上加入新变量,回归结果如下:加入新变量的回归结果变量R-squared Adj R-squaredY X4 X6 0.9967 0.9962Y X4 X6 X1 0.9969 0.9963Y X4 X6 X2 0.9969 0.9963Y X4 X6 X3 0.9967 0.996Y X4 X6 X5 0.9967 0.996从回归结果可以看出,加入解释变量X1或X2时,t值不显著,所以去掉X1和X2,最后只留下解释变量X4和X6。
reg Y X4 X6Source | SS df MS Number of obs = 19-------------+------------------------------ F( 2, 16) = 2387.58Model | 77430826.1 2 38715413 Prob > F = 0.0000Residual | 259445.739 16 16215.3587 R-squared = 0.9967-------------+------------------------------ Adj R-squared = 0.9962Total | 77690271.8 18 4316126.21 Root MSE = 127.34------------------------------------------------------------------------------Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------X4 | .2965213 .0090498 32.77 0.000 .2773365 .3157062X6 | 160.977 24.23799 6.64 0.000 109.5947 212.3592_cons | -906.7129 232.1304 -3.91 0.001 -1398.807 -414.6185------------------------------------------------------------------------------从回归结果在可以看出,经过修正后的模型,F 值显著,各解释变量的t 值显著,拟合优度为0.9967,所以修正多重共线性后的回归结果为:46 -906.7129 0.2965213X + 160.977X Y =+ (-3.91) (32.77) (6.64)2 0.9967R = 20.9962R = 2387.58F =四、结论1.人均国内生产总值与城乡居民消费水平呈线性关系,当人均GDP 增长100元时,城乡居民消费水平增长29.65元。