2015年“高信杯”青岛科技大学大学生数学建模竞赛题目基于多元线性回归的青岛市房价预测模型摘要随着我国住房制度的商品化改革,我国住宅产业蓬勃发展,逐渐成为影响国计民生的重要产业之一。
本文针对青岛市住宅房地产的价格问题,首先对影响房价的各个因素进行统计分析,然后对各个影响因素进行相关性分析,再建立合适的房价模型并检验,最后对房价进行灰色预测。
针对问题一,本文对青岛市2006-2013年的商品房平均销售面积、房地产开发投资额、地方财政一般预算收入、GDP、市区人口、人均消费性支出、居民可支配收入、人均住房面积、恩格尔系数、竣工房屋面积的相关数据与商品房平均销售价格进行相关性分析,得出数据间的Person系数和显著性水平,进一步去除内在相关性强的数据指标,最终得到四个比较独立的影响指标:人口、GDP、人均住房面积、竣工房屋面积。
针对问题二,把与商品住宅价格有强联系的四个影响指标作为自变量,把商品住宅价格作为因变量,建立多元线性回归模型,通过spss软件得到非标准化系数,得到模型方程,以及他们对价格影响的大小。
进一步分析回归结果与实际房价的误差,检验模型,最终证明模型合理可行,结果精良。
针对问题三,本文通过灰色预测模型对四个影响指标分别进行未来5年预测分析,把预测结果代入房价模型中,得到2006-2018年的房价数据, 2006-2013年数据与实际数据吻合很好,未来房价仍保持上升趋势。
关键词:青岛市住宅价格;相关性分析;多元线性回归;灰色预测一、问题重述随着青岛市城市化进程的推进,城市住宅投资规模不断扩大,住宅销售面积逐年增加,住宅价格下一步如何增长?这一问题对政府、企业和广大市民具有普遍的现实意义。
在此背景下,请借助网络搜集青岛市近年来经济发展和房地产销售的相关数据,以青岛市住宅房地产的价格为研究对象,探讨住宅价格的走势及主要影响因素通过实证的方法来检验分析的结果。
同时,建立起科学合理的房价模型,为政府调控、企业经营和购房者投资提供帮助,保障我市住宅产业健康、持续的发展。
根据题意,本文需要解决的问题有:1、搜集影响房价的因素,通过相关性分析确定青岛市房价的主要影响因素。
2、分析主要影响因素的特征,建立科学合理的房价模型。
3、预测住宅价格走势。
二、模型假设假设1:假设本文只研究住宅体系中的商品住宅,不考虑占比例很少的经济适用房和廉租房。
假设2:假设没有严重自然灾害、经济危机等不可抗因素的影响。
假设3:假设在讨论房价受相关因素影响时,不考虑消费者的心理因素。
假设4:假设在讨论房价受相关因素影响时,不考虑非正常需求而引起房价上涨的因素,如炒房行为、政府政策等。
三、符号说明变量含义1x人口2x人均住房面积(平方米/人)3x GDP(亿元)4x竣工房屋面积(万平方米)y商品房平均销售价格(元/平方米)四、问题分析通过分析本文将问题分成下列三个问题:1、分析查找影响青岛市住宅销售价格的可能因素,遴选出主要影响因素。
2、以主要影响因素为自变量建立科学合理的房价模型。
3、通过房价模型预测住宅价格走势。
z首先影响房价的因素涉及生活,生产,政府政策的方方面面,本文打算从GDP、房地产投资总额、地方一般性财政预算收入、居民可支配收入、商品住宅销售价格、居民消费性支出、恩格尔系数、市区人口、城市人均居住面积、竣工房屋面积、房屋平均销售面积这十一个因素分为需求和供给两个方面分析影响房价的主要因素。
通过相关性分析或者主成分分析方法得到与房价相关性高的因素,进一步剔除内在相关的因素,最终得到主要的相互比较独立的影响因素。
在主要影响因素的基础上,考察尽可能多的数据,建立多元线性回归模型,得到房价模型,并通过各种检验方法检验模型的合理可行性。
最后预测住宅价格走势,本文选择未来5年2014-影响房价指标分析相关性分析选取主要影响因素预测住宅价格走势模型检验多元线性回归建立房价模型分析流程图2018年的数据增长情况,首先需要预测各个主要影响因素,针对不同的影响因素的规律特征,有灰色系统预测、时间序列、回归拟合等不同的预测方法,比较各种预测方法的优缺点,选取对应合适的预测方法。
将最终预测结果带入房价模型中,即可得到未来5年的房价结果,并检验模型的准确性。
五、影响因素分析影响房价的因素是多种多样的,我们就供给和需求两个方面分析一下影响青岛市房价的主要因素。
5.1在需求方面的主要因素包括:1.城市人口数量:城市人口的数量会直接影响到城市住房的需求量,它会通过供给关系的市场规律而影响房价。
2.国内生产总值:即GDP ,是衡量国民经济发展的总体标准,是商品住宅活动的主要影响因素,GDP 值增长速率快说明社会经济发展水平高,对住宅的需求高,也就是说GDP 与住宅需求呈正相关。
3.人均居住面积:人均居住面积是很多不可量化因素的综合体,比如国家的各种政策法规,经济发展水平,人们的购房换房欲望等。
在人们具备购买的前提下会对人均住房面积产生影响,决定人们对住房的需求。
4.恩格尔系数:恩格尔系数即食品消费支出与居民消费支出总额的比值。
恩格尔系数越小,就说明这个地区经济发展越发达,居民对住宅的购买能力就越强,需求因素人口GDP人均住房面积恩格尔系数人均消费性支出 居民可支配收入竣工房屋面积 房地产开发投资额地方财政一般预算收入商品房平均销售面积供给因素对房屋的需求就越大。
5. 居民可支配收入:居民可支配收入的高低直观的反映了人民的平均收入水平,从而决定了商品住宅市场的需求大小。
可支配收入与住宅需求呈正相关。
6. 居民消费性支出:居民消费性支出包括食品消费性支出,居住消费性支出等,居民的年人均可支配收入与其消费性支出占其年的可支配收入的比例越小,其具备购买商品住宅的能力越大。
表格 1 需求影响因素数据图一需求因素走势图5.2在供给方面的主要因素包括:1.商品房平均销售面积:住宅的实际销售面积直接反映了我国城镇居民对住房的需求,当经济发展迅速,人均可支配收入水平增加的时候,消费者购买能力就增强,消费者对住房的需求就增加,那么实际销售面积也会增加。
2.地方财政一般预算收入:房地产与地方财政具有同向的变动关系,房地产业的繁荣带动了相关税收的增长,财政收入也随即增加。
3. 房屋的竣工面积:在完全竞争的房地产市场中,房屋的竣工面积直接影响到住房的供求关系。
如果当年的住房竣工面积量大,房屋的供应量大,在需求不变的情况下,住房的价格会上升。
4. 房地产开发投资额:房地产开发投资额可以直接影响房地产的供给,如果年度开发投资额多,房地产供应量就会增加。
往往投资额增加会导致房价下降。
表格 2 供给因素数据表2006-2013年*数据来自青岛市统计年鉴图二供给因素走势图5.3影响因素的相关性分析相关性分析是一种讨论变量之间相关程度的统计分析方法。
在相关性分析中,所有变量是被同等看待的,也就是说自变量与因变量是不予以区分、不考虑因果关系的,并且所有变量都假定为随机变量。
本文运用SPSS软件对搜集的数据进行相关性分析,在商品房平均销售价格、商品房平均销售面积、GDP、人均住房面积、人均消费性支出、居民可支配收入、恩格尔系数地方财政一般预算收入、竣工房屋面积、房地产开发投资额这十一个因素与因变量(即商品住宅销售价格)的相关程度从高到低依次排列,排列顺序为:GDP、房地产开发投资额、居民可支配收入、人均消费性支出、地方财政预算收入、市区人口、竣工房屋面积、人均住房面积、销售面积、恩格尔系数。
运行处理之后得到的数据整理结果见表格4。
表格 3相关性分析结果**. 在 .01 水平(双侧)上显著相关。
*. 在 0.05 水平(双侧)上显著相关。
将这十一个影响因素进行两两因素之间的相关性分析,找出与商品住宅销售价格相关程度较高的自变量,并排除掉与这几个自变量相关程度较高的其余次要的变量。
其中,销售面积、恩格尔系数与商品住宅销售价格的关系不明显,不相关的可能性超过了5%,所以最先排除掉房屋销售面积、恩格尔系数这两个因素;地方性财政预算收入、房地产开发投资额与住宅销售价格的相关程度高,而且房地产开发投资额与商品住宅销售价格的相关性大于地方性财政预算收入这个因素与商品住宅销售面积的相关性,所以排除地方性财政预算收入这两个因素;同理,居民可支配收入GDP 相比也是应该被排除的因素。
由于人均消费支出、房地产开发投资额与GDP 的相关程度高,而GDP 与商品住宅的销售价格的相关性高于人均消费支出、房地产开发投资额与住宅价格的相关性,所以排除人均消费支出、房地产开发投资额这两个因素。
相关数据见表格4。
表格 4两两因素相关性分析所以,通过上面的数据分析可以得出影响青岛市商品住宅销售价格关键因素是:GDP 、市区人口、人均住房面积、竣工房屋面积。
六、房价回归模型的建立与求解假定在分析某一因素对房屋价格的影响时,其他影响因素对房价的影响基本不变。
从住宅需求角度分析了GDP 、居民可支配收入、居民消费性支出、恩格尔系数市区人口、人均居住面积六个方面;从住宅供给角度分析了商品房平均销售面积、地方财政一般预算收入、房屋竣工面积、房地产开发投资额四个方面。
根据网络搜集的数据得到近几年的一些数据指标,并采用多元线性回归模型来考察影响房价变化的一些主要因素。
6.1模型准备——多元线性回归模型回归分析中最简单的形式是x y 10ββ+=,y x ,均为标量,10,ββ为回归系数,称一元线性回归。
它的一个自然推广是x 为多元变量,形如m m x x y βββ+++= 110 (1)2≥m ,或者更一般地)()(110x f x f y m m βββ+++= (2)其中),,(1m x x x =,),,1(m j f j =是已知函数。
这里y 对回归系数),,,(10m ββββ =是线性的,称为多元线性回归。
不难看出,对自变量x 作变量代换,可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。
在回归分析中自变量),,,(21m x x x x =是影响因变量y 的主要因素,是人们能控制或能观察的,而y 还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的正态分布,于是模型记作⎩⎨⎧++++=),0(~2110σεεβββN x x y m m (3) 其中σ未知。
现得到n 个独立观测数据),,,(1im i i x x y ,m n n i >=,,,1 ,由(3)得⎩⎨⎧=++++=ni N x x y i iim m i i ,,1),,0(~2110 σεεβββ (4) 记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=nm n m x x x x X 111111, ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n y y Y 1 (5)T n ][1εεε =,T m ][10ββββ =(4)表为⎩⎨⎧+=),0(~2σεεβN X Y (6) 6.2建立多元线性回归模型与求解①通过对青岛市商品住宅市场需求量影响因素的相关性分析,得出对青岛市商品住宅需求量因变量影响程度较大的四个自变量,分别为竣工房屋面积,人口,人均住房面积,GDP 。