当前位置:文档之家› 计量经济学北京地区房价影响因素回归分析

计量经济学北京地区房价影响因素回归分析

北京房价影响因素回归分析摘要研究选择北京地区房价与多个可能相关的变量, 建立计量经济学模型从而估计各因素的影响程度。

通过数据采集后,画图,看走势,合理建立多元回归公式化的预测模型, 借助SAS软件,首先对模型进行共线性检验,筛选变量,得到共线性处理后的多元回归模型。

然后进行经济意义检验,统计学检验(拟合优度,显著性检验),计量经济学检验(异方差检验,序列相关性检验),最后基于模型对房价进行了预测检验。

关键词房价多元回归线性模型计量经济学检验统计检验1 引言改革开放以来,随着经济体制的改革深化和经济的快速增长,中国的房价也一直在快速增长。

为了研究房价增长的主要因素,分析房价的变动规律,从数字上进行更加严密的分析,需要建立计量经济学模型,从而找出谁是影响房价的最重要的因素。

我平常看《财经郎眼》节目,最近的一期讨论了中国房价的未来走势问题,郎咸平教授说,房价他不敢预测,因为无法预测。

并且强调自己擅长逻辑分析,对于计量并不擅长。

在三剑客环节,马光远教授提出影响房价的五大因素是:一货币发行量,二供求关系,三中国经济的发展,四城镇化水平,五土地政策。

对此我要做出更深的探究,到底它们是如何影响的呢,影响多大程度。

其中对于土地政策无法量化,暂不研究。

本文主要针对1997—2012年间,北京房价的变化及其影响因素进行分析,通过收集北京地区生产总值,北京人均收入,常住人口,常住外来人口,商品房施工面积,竣工面积,销售面积,待销售面积,以及全国GDP,货币和准货币(M2)供应量(以下简称人民币发行量),城镇化水平的数据,建立统计模型。

(全国性的房价我个人认为数据并不合理,不具有代表性,所以研究地方)2 计量经济学方程设定线性回归模型为:t i i i u X X X Y +++++=ββββ 22110 (1)t u 随机误差项3 数据收集从国家统计局《统计年鉴》获取以下数据:全国GDP ,货币和准货币(M2)供应量,城镇化水平。

在北京统计局《统计年鉴》获得以下数据:北京地区平均房价,北京地区生产总值,北京人均收入,常住人口,常住外来人口,商品竣工面积,销售面积,待销售面积。

数据如下(具体数据可见附录数据输入)Y 为北京房价,X1北京地区生产总值,X2人均收入,X3常住人口,X4外来常住人口,X5商品房施工面积,X6竣工面积,X7销售面积,X8待销售面积,X9人民币发行量,X10国民生产总值,X11城镇化,u t 随机误差项。

: nYX1X2....X9 x10 X11 1997 4643.0 2077.1 16621 90995.3 78,060.85 0.31 1998 4624.0 2377.2 19128 104498.5 83,024.28 0.32 1999 4602.0 2678.8 21407 119897.9 88,024.38 0.34 2000 4685.0 3161.7 24127 134610.398,000.450.352001 4686.0 3708.0 26980 158301.9 108.068.22 0.36 2002 5066.0 4315.0 30730 185006.97 120,332.69 0.39 2003 5526.0 5007.2 34777 221222.8 135,822.76 0.41 2004 6536.0 6033.2 40916 254107159,878.34 0.422005 7557.0 6969.5 45993 298755.7 184,937.37 0.43 2006 8571.0 8117.8 51722 345603.59 216,314.43 0.44 2007 9899.09846.8 60096403442.21 265,810.31 0.46 2008 9953.0 11115.0 64491 475166.6 314,045.43 0.47 2009 16032.0 12153.0 66940 606225.01 340,902.81 0.48 2010 24005.0 14113.6 73856 725851.8 401,512.80 0.50 2011 28081.0 16251.9 81658 851590.9 473,104.05 0.51 2012 34487.0 17879.4 87475974159.46 519,470.10 0.534 模型的建立4.1 画散点图及公式建立首先,通过被解释变量与解释变量的散点图大致判断房价与其余几个变量的函数关系。

程序见附录,图一为y与x1的散点图。

其他图类似,在此省略。

程序见程序1。

图一由图一知,我们不能简单的假设房价与其他变量是线性关系,同时我做出了俩边取对数与只对于y去对数的比较。

图二为lny与x1的图像,图三为lny与lnx1的图像。

见程序2。

图二图三由图二和图三知,(当然不止是这俩个图,其他变量的得到的图像大多与上类似)我们得到模型对y 取对数的图像最符合线性关系。

所以建立模型1111443322110ln X X X X X y ββββββ+++++= (2)4.2使用最小二乘法(OLS )估计回归模型 程序见附录程序3,图四根据上面模型,2R =0.9986,可决系数高,拟合度好。

图五由数据可知该模型的有些变量数据拟合不够好,进行多重共线性检验。

见程序4。

图六由图六知方差膨胀因子有的都达到上万,有严重共线性,进行逐步回归。

见程序5。

第一步:引入X9,模型的拟合度提高,参数符号合理,通过了t 检验。

第二步:引入X3,模型的拟合度提高,参数符号合理,通过了t 检验。

第三步:引入X8,模型的拟合度提高,参数符号合理,通过了t 检验。

第四步:引入X6,模型的拟合度提高。

第五步:去掉其他变量。

看处理多重共线性后膨胀因子:图七由以上结果可知,数据明显有了不少的优化,虽然大于10,但相对于原先的成千上万好了非常多。

认为已克服多重共线性。

见程序6。

故克服多重共线性后的模型为:986300000322.000046081.000009311.000015231.028055.8ln X X X X Y +-+-=(3)5 相关检验5.1 经济意义检验人口的增加引起房价的下降,竣工面积的增加引起房价的负增长,这显然是不合理的。

但考虑到x8待销售面积的增加引起房价的下降符合经济意义。

我们暂时认为其组合表示一种比较复杂的供求关系。

人民币的发行量越多房价越上涨也符合经济意义。

5.2 统计检验(1)拟合优度:0.99672R ,故本模型拟合效果很好。

(2)由图七知,t 值检验对应的p 值都小于0.05,所以回归系数显著。

5.3 计量经济学检验 5.3.1 异方差的检验5.3.1.1 图示检验法检验异方差程序见附录,在此仅列出X6与2e 的图像。

见附录程序7。

图八可以看出图像图像的走势不易确定(整体成直线,但结尾几个点又明显向上)5.3.1.2 戈里瑟法检验法检验异方差 程序见附录程序8,图九t 值对应p 值都未通过检验,因此通过原假设,即模型不存在异方差。

5.3.1.3 G-Q 检验法检验异方差程序见附录程序9,G-Q 检验适用于样本容量较大,且异方差为单增或单减的情况,但模型我们也检验一下。

模型样本容量为16,去掉中间16/4=4组观测,分为各有6个容量的两个样本。

再分别对模型进行线性回归。

输出结果如下:子样本1:,90.032581.0690-61.53420-33.6489618.4792X X X X Y ++=0.97792=R ,297481271=RSS子样本2:90.05090811.53509-64.96326-32.6491813303X X X X Y ++=,0.98962=R ,53057752=RSS 6067.553057752974812712===RRS RSS F ,服从F (1,1),在0.05水平下,临界值为161,远小于。

所以不存在异方差。

(当然此方法适合大样本,在此主要是学习此方法)5.3.1.4 没有交叉项的怀特检验法检验异方差 程序见附录程序10,图十由0064.116879.0*162==nR 小于查表下的自由的为8,置信水平为0.05下2χ分布的值15.51.所以通过异方差检验,不存在异方差。

5.3.2序列相关性检验5.3.2.1 DW 检验法检验序列相关性 程序见附录程序11,图十一由结果可知在0.05置信水平下,落入l u d d -<<-4390.24(其中93.1=u d ,73.0=l d )无法确定是否具有自相关。

5.3.2.2 拉格朗日乘数检验检验序列相关性 程序见附录程序12含1阶滞后残差项的辅助回归拉格朗日乘数检验序列相关运行结果图十二LM=15*0.0687=1.0305,该值小于显著性水平为5%的自由度为1的2χ分布临界值3.84.所以无一阶序列相关性。

图十三LM=14*0.0794=1.1116,该值小于显著性水平为5%的自由度为2的2χ分布临界值3.84.所以无二阶序列相关性。

5.3.2.3 多重共线性检测程序见附录程序13,在置信水平为5%,只剩下x9。

当然上面已经克服多重共线性,在此就不赘述。

5.4 经济模型预测检验t u X X X Y +++=9863X 0.000003220.00046081-0.000093110.00015231-8.28055ln 根据上式,代入2013年人口x3=2069.3,竣工面积x6=2428.9,待销售面积x8=2369.2,人民币发行量1057,254.23。

于是的到y 的预测值36466.1。

实际价格36354。

误差%3.036354363541.36466=-=-=Y YY e ,预测效果很好。

对于置信度为5%的模型我们不妨试一试效果。

t u Y ++=9X 0.000002478.14408ln =46887.104.误差较大。

6 结论及建议由以上得到的房价影响因素可知,对北京房价影响最重要的是货币发行量,其次是供求关系(对于供求关系并未能很好表示,让其通过置信度为5%的检验)。

我对已经取得的结果,房价最重要的影响因素其实是货币发行量,已经感到很是兴奋。

也就是说对于房价未来走势,我们的货币发行量不降低,房价上涨可能性比较大。

货币发行量的增加,很重要的原因是美元的滥发,为了维持汇率稳定,政府也开始大量印货币。

也就是如果房价不涨的话,势必物价会以更快的速度增加。

无论怎样,货币的大量发行,通过税收,会导致政府的财政收入进一步增加。

(查了政府的财政收入,每年百分之十几的增速,明显高于gdp )我的建议是政府进一步扩大对基层的财政支出,以及对其他地方财政支出,推动社会发展。

相关主题