影响我国旅游收入的因素分析学院:经济学院年级:2014级专业:经济统计学学号:2014103025姓名:雷丹【摘要】旅游业作为我国国民经济的重要产业之一,在我国经济发展中起到了重要的作用。
为了促进旅游业更好的发展,需要研究影响旅游业发展的因素。
本文基于1994-2014年的数据,运动Eviews软件,从影响国内旅游收入的因素中选择国内旅游总人数、城镇居民家庭可支配收入、公路里程数、铁路营业里程数以及星级酒店总数建立回归模型,利用逐步回归法消除模型的多重共线性并进行异方差和自相关性的检验,最终建立科学合理的回归模型,做出相应的政策建议。
一、引言改革开放以来,我国的经济社会持续快速发展,人均可支配收入明显提高,居民的闲暇时间大量增多,在保证物质生活的质量的同时,人们开始重视精神生活,外出旅游成为人们享受生活的主要方式。
尤其是20世纪90年代以来,我国国内旅游收入增长率高达14.6%,远远高于GDP增长水平。
如图1是1994-2013年我国国内旅游收入的走势图。
因此,为了规划中国未来旅游收入的发展,充分利用旅游业发展国民经济,使旅游业在国民经济发展中扮演越来越重要的角色。
图1:1994-2013年国内旅游收入(数据来源:中国统计年鉴2014)二、国内旅游因素的影响收入及数据选取影响旅游收入的因素有很多,例如季节不同往往旅游人数、旅游收入不同,距离远近也会影响旅游业的发展,往往人们偏好于方便并且距离较近的旅游景点;再者,景点环境、景区类型也会影响旅游发展。
综合现有研究文献和相关数据收集,本文按照建模和数据收集的难易程度将当前影响中国旅游收入的因素分为以下几个方面:一是游客总人数。
国内旅游人数是衡量一个国家或地区旅游业发展水平的重要指标之一,旅游人数是刺激旅游收入增长最直接的因素之一,只有具备了庞大的消费人群,经济收入才会不断增加。
二是城镇居民人均可支配收入。
查阅相关数据可知,旅游人数中大部分是城镇居民,因此本文不直接采用居民人均可支配收入指标而采用城镇居民人均可支配收入来研究其对旅游收入的影响。
三是交通状况。
通常交通状况好的地方越能吸引游客,营业里程越远路费越高,给铁路局和收费站带来的收益也越高,也会给本地区带来更多的旅游收入。
所以本文选用公里里程数和铁路里程数两个指标研究交通状况对旅游收入的影响。
四是星级酒店总数。
人们出去旅行离不开住宿,旅游业越发达的地区酒店宾馆等住宿的场所也会相应的增多。
因此我们可以研究星级酒店数对旅游收入的影响。
由于中国统计年鉴上收录的影响国内旅游收入的相关因素的数据最早记录是在1994年,最新能从统计年鉴上下载的数据是到2013年,因此本文的分析基于1994-2013年的数据。
三、模型的设立、估计与修正(一)描述分析本文将国内旅游收入作为被解释变量,国内旅游人数、城镇居民可支配收入、公路里程数、铁路营业里程数作为解释变量。
[1].国内游客总人数【X1】与国内旅游收入【Y】之间的相关性分析。
由散点图可知,国内游客总人数【X1】与国内旅游收入【Y】之间存在正相关关系。
[2].城镇居民可支配收入【X2】与国内旅游收入【Y】之间的相关性分析。
5,00010,00015,00020,00025,00030,0005,00010,00015,00020,00025,00030,000X 2Y由散点图可知,城镇居民可支配收入【X2】与国内旅游收入【Y 】之间存在较强的正相关关系。
[3]. 公路里程数【X3】与国内旅游收入【Y 】之间的相关性分析。
05,00010,00015,00020,00025,00030,000100150200250300350400450X 3Y由散点图可知,公路里程在某一年份区间增加得特别快,但总体来说,公路里程【X3】与国内旅游总收入【Y 】之间存在正相关关系。
[4]. 铁路营业里程数【X4】与国内旅游收入【Y 】之间的相关性分析。
05,00010,00015,00020,00025,00030,000567891011X 4Y由散点图可知,铁路营业里程【X4】与旅游总收入【Y 】之间存在正相关关系。
[5]. 星级酒店总数【X5】与国内旅游收入【Y 】之间的相关性分析。
5,00010,00015,00020,00025,00030,0002,0004,0006,0008,00010,00014,000X 5Y由散点图可知,星级酒店总数【X5】与国内旅游总收入【Y 】存在一定的正相关关系,但不是绝对的正相关。
(二)模型设定根据以上描述分析的结果,初步建立如下模型:Y=β1+β2X1+β3 X 2+β4 X 3+β5 X 4+β6X5+μ其中,旅游总收入为Y,国内旅游人数为X1,城镇居民可支配收入为X2,公路里程数为X3,铁路营业里程数为X4,星级饭店总数为X5。
表1:1994-2013年国内旅游收入及其相关数据如下数据来源:中国统计年鉴(2014)根据表1的数据,利用Eviews软件进行参数估计,结果如下:Variable Coefficient Std. Error t-Statistic Prob.C -12112.46 5645.548 -2.145488 0.0499X1 14.30274 2.577833 5.548357 0.0001X2 -0.664324 0.391312 -1.697686 0.1117X3 -14.67492 5.472413 -2.681619 0.0179X4 1592.342 994.8114 1.600647 0.1318X5 -0.056024 0.130289 -0.429993 0.6737R-squared 0.994577 Adjusted R-squared 0.992640由此,初步预测模型为:Y = -12112.457 + 14.303*X1- 0.664*X2- 14.675*X3+ 1592.342*X4- 0.056*X5四、模型的修正与检验(一)多重共线性检验由于R2 较大且接近于1, 而且F=513.477 >F0.05(5, 14)=2.96, 所以国内旅游收入与上述解释变量间总体线性关系显著。
但由于t0.025 (20 -5-1)=2.145, 不仅X2、X4、X5参数估计值未能通过t检验, 而且符号的经济意义也不合理, 这表明解释变量之间存在多重共线性。
于是做了解释变量之间的相关系数矩阵如下:由矩阵结果可知,除了【X5】以外,各解释变量之间相关系数都很高,证实解释变量之间确实存在多重共线性问题。
现利用逐步回归法消除多重共线性问题。
第一步:各解释变量与被解释变量分别做一元回归,结果如下:表3:一元回归X1 Y = -4274.2709312 + 8.68458362164*X1R2=0.970176 F=619.0666X2 Y = -3943.78531939 + 0.994933857478*X2R2= 0.941549 F= 289.9509X3 Y = -5021.76139433 + 49.1136660416*X3R2= 0.706060 F=43.23705X4 Y = -36851.616325 + 5811.29000984*X4R2=0.926067 F=225.4633X5 Y = -5191.256918 + 1.28687885398*X5R2=0.457233 F=15.16343由上述回归发现【Y】与【X1】的回归具有最大的可决系数,可见,旅游收入受旅游人数的影响最大,与经验相符,因此选择【Y】与【X1】的回归模型为初始回归模型。
将其他解释变量分别导入初始回归模型,寻找最佳回归方程。
表4:逐步回归t (-7.765) (-24.881)Y=f(x1,x2) -4377.141 18.333 -1.128 0.981 t (-10.08)-6.566 (-3.475)Y=f(x1,x2,x3) -3035.899 13.62340 -0.279423 -18.52854 0.994 t (-7.849)(6.722)(-1.039)(-5.012)Y=f(x1,x2,x4) -20507.52 19.775 -1.770 2824.407 0.972 t (-2.977)(7.731)(-4.445)(2.345)Y=f(x1,x2,x4,x5)-19643.49 13.852 -0.974 2952.316 -0.301 0.992 t (-3.375)(4.530)(-2.191)(2.902)(-2.734)在【X1】的基础上纳入【X2】后,变量【X2】城镇居民人均可支配收入这一变量之前的系数是-1.128,说明人均城镇居民的收入与旅游收入是负相关的,这与我们所作的假设是相悖的。
这一系数同时也说明了人均城镇居民收入的边际旅游倾向是递减的。
这种现象的原因我们认为是:首先,旅游是属于较高层次的消费支出,居民在拥有了足够的可自由支配的收入和闲暇时间后,才会有出去旅游的愿望和行为。
现代城市生活节奏加快,城市居民很少有闲暇时间去旅游。
其次,我国宏观改革中,诸如住房、教育、医疗保险、社会保障等制度的改革,导致城市居民未来预期支出上升;市场化改革的加速,职工下岗,导致城市居民未来预期收益下降;因此很多居民更偏好于将多余的收入转化为储蓄而不去消费。
因此城镇居民的边际旅游倾向为负。
因此在【X1】、【X2】的基础上继续纳入【X3】,显然X3的回归结果不符合描述分析中所述的那样,所以直接剔除【X3】,继续纳入【X4】,纳入【X4】后的方程通过检验且符合经济意义,因此在【X1】、【X2】、【X4】的基础上纳入【X5】,【X5】的系数为负,考虑其原因可能是和城镇居民人均可支配收入的系数为负的原因相似,本来按常理来说,如果星级酒店总数越多,反映了当地的旅游业发展得越好,旅游人数也会越多,但是另一方面星级酒店数越多也意味着消费越多,进一步考虑到当下的宏观经济走势,由于许多不确定因素,使人们预期收入会减少,因此人们可能会更偏好于消费较低的旅游地区。
所以星级酒店总数前的系数为负。
综上,在显著性水平为5%的条件下,最终回归模型为:Y = -19643.493 + 13.852*X1 - 0.974*X2+ 2952.316*X4- 0.301*X5(-3.374)(4.531)(-2.191)(2.902301)(-2.734)R2= 0.991791 F= 453.0548(二)异方差检验根据上述回归模型,进行异方差检验。
建立模型检验方程:e2=C+a1X1+a2X2+a3X4+a4X5+a5X12+a6X22+a7X42+a8X52要检验的同方差性假设为H0:a1=a2=a3=a4=a5=a6=a7=a8=0检验结果如下:White Heteroskedasticity Test:F-statistic 3.719836 Probability 0.023754Obs*R-squared 14.60238 Probability 0.067354由上表可知:Obs*R-squared=14.60238 卡方在0.05的显著水平下,查表得临界0.05(8)=15.51>14.60238,因此接受原假设,方程具不存在异方差值,临界值χ2性。