我国旅游业收入影响因素研究学院:班级:姓名:学号:摘要:近年来,中国旅游产业有了长足的进步,成为中国经济发展的支柱性产业之一,发展潜力巨大,通过建立合理的计量经济学模型,寻求我国旅游业收入和相关影响因素之间的函数关系,分析各因素对旅游业发展的贡献,揭示了我国旅游业收入呈现的特征,并针对我国旅游业的发展现状提出了一些对策建议。
关键词:旅游业;国内旅游收入;旅行社数量;旅游人数;人均花费;改革开放以来,中国旅游业取得了飞速发展。
从上世纪九十年代末国内接待旅游人数695百万人次到如今26.4亿人次;从旅游收入仅2391亿元到如今1.93万亿元;旅行社以年均21.24%的速度增长;旅游直接从业人员更是年均增长15%。
留有基础设施、配套服务更加完善为我国旅游业带来了巨大的经济效益。
然而展望我国旅游业的发展前景,为了旅游业收入的稳定增长,研究其影响因素的多样性与复杂性十分必要。
本文以计量经济学经典的模型为基础,分析影响中国旅游业收入的各个因素,对比不同因素的影响程度大小。
文章首先进行研究变量的选择和模型的建立,然后进行回归分析,进而进行经济意义检验、统计检验、计量经济学检验,在此基础上,最后提出相应的建议。
1 模型变量与模型建立1.1 模型解释变量的选择旅游收入直接反映了某一旅游目的地国家或者地区旅游经济的运行状况,是衡量当地旅游经济活动及其效果的一个不可或缺的综合性指标。
在现实生活中,影响中国旅游业收入的因素有很多,考虑到样本数据的可收集性和我国旅游业的实际情况,选择人均花费(1X )、旅游人数(2X )、全国旅行社数量(3X )、铁路营业里程(4X )和公路里程(5X )作为影响的主要变量。
1.2 模型设定设定线性模型:μββββββ++++++=55443322110X X X X X YY —国内旅游业收入(亿元); 1X —人均旅游花费(元); 2X —旅游人数(百万人次);3X —全国旅行社数量(个); 4X —铁路营业里程(万公里);5X —公路里程(万公里)。
1.3 数据搜集(见表1)表1 1995—2011中国国内旅游业收入及其相关影响因素统计表2 回归参数估计用Eviews 软件对表1数据进行OLS 回归估计得如下结果(见图1)图1 Eviews 回归结果根据回归结果可以建立如下函数:54321624531.629416.58212273.0709256.885272.11314.5744ˆX X X X X Y -+-++-=)503791.1(-()980838.9()918711.4()780180.1-()083947.0()853129.2-995359.02=R 8187.471=F 731310.1..=W D3 经济意义检验、统计检验 3.1 经济意义检验估计结果说明,在假定其他变量不变的情况下,人均旅游花费每增加一元,全国旅游业收入将增加11.85272亿元;旅游人数每增加1百万人次,全国旅游收入将增加8.709256亿元;铁路营业里程每增加1万公里,全国旅游收入将增加58.29418亿元,这与理论分析和经验判断相一致。
但3X --全国旅行社数量和5X --公路里程的符号为负,即随着全国旅行社数量和公路里程的增加国内旅游业收入将减少,这与经济原理相悖。
说明1X 、2X 、4X 具有经济意义,通过经济检验。
3.2 统计检验统计检验的目的是为了检验估计值的统计可靠性和准确性,为此,进行如下检验:(1)拟合优度:指回归直线对观测值的拟合程度,越接近1,说明回归直线对观测值的拟合程度越好。
由回归参数估计结果看:995359.02=R 说明模型对样本的拟合较好。
(2)F 检验:由回归结果看8187.471=F ,给定显著性水平5%,查表得到临界值2.3)11,5(05.0=F 。
()11505.0,F F >表明模型的线性关系在95%的置信水平下显著成立。
(3)t 检验:在5%显著水平下自由度为15的临界值()131.215025.0=t ,从t 的检验值来看,1X ,2X ,3X ,4X ,5X 的绝对值并不全都大于2.131,这可能是由于多重共线性导致的。
4 模型的计量经济学检验与修正4.1 多重共线性检验4.1.1 检验简单相关系数X、2X、3X、4X、5X的相关系数如表2所示:1表2 相关系数表由表中数据发现X与4X间存在高度相关性。
24.1.2 找出最简单的回归形式分别作X、2X、3X、4X、5X间的回归:1(1)(2)2599372.7613.3230ˆX Y +-= ()139489.6- ()21054.19960942.02=R641251.0..=W D (3)112474.36207.9942-ˆX Y +=()938829.5-()758520.9863919.02=R 309467.0..=W D3612731.0873.2300ˆX Y +-= ()703044.1- ()693678.6749186.02=R 545242.0..=W D (4)4327.50158.31479ˆX Y +-= ()47560.10-()50155.12912429.02=R 263336.1..=W D (5)574253.3414.2568ˆX Y +-=()794145.1- ()476466.6 736586.02=R 751404.0..=W D可见,全国旅游业收入受旅游人数影响最大,与经验符合,因此选(2)为初始的回归模型。
4.1.3 逐步回归将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程(表3)。
表3 逐步回归C2X 1X 3X4X 5X2R..W D-3230.613 7.599372 0.960942 0.641251t 值-6.139489 19.21054-5251.108 5.953019 9.123281 0.970943 0.598842t 值-5.081280 7.1808512.195081()312,,X X X f Y =-5969.792 8.111965 13.97647 -0.299476 0.993836 1.093224t 值 -11.82971 16.11047 6.637420 -6.9486964039.648 7.779864 13.16836 -1778.396 0.975016 0.461057t 值0.6254655,232181 2.704074-1.455862()512,,X X X f Y = -4490.786 9.001009 7.753226 -15.70312 0.990671 1.950554 t 值-7.188291 11.86413 3.154436-5.243059讨论:第一步,在初始模型中引入 ,模型拟合优度提高,且参数符号合理,变量也通过了t 检验。
第二步,引入 , 拟合优度再次提高,但是参数符号不合理,因此未通过检验。
()2X f Y =()12,X X f Y =()412,,X X X f Y =1X 3X第三步,引入 4X ,拟合优度下降,同时参数符号不合理,因此未通过检验。
第四步,引入 ,拟合优度提高,但是参数符号不合理,因此未通过检验。
因此,全国旅游业收入函数应以 为最优,拟合结果如下:12123281.9953019.5108.5251ˆX X Y ++-=4.2 异方差检验4.2.1采用怀特检验。
所得结果如图所示211222255590.4338.33215563546.0668.12505708559~X X X X e +--+=怀特统计量 ,该值大于5%显著性水平下,自由度为4的2χ分布的相应临界值49.905.02=χ,因此,拒绝同方5X ()12,X X f Y =714087.13806711.0172=⨯=nR ()701443.2()361426.0()354698.0-()640946.1-()538181.1806711.02=R差的原假设。
4.2.2下面对原模型进行回归。
()812844.1 ()235739.0- ()249968.0 ()375428.0- ()238182.0 292524.02=R 怀特统计量 ,该值小于5%显著水平下,自由度为4的2χ分布的相应临界值49.905.02=χ,因此,不拒绝同方差的原假设。
4.2.3 异方差修正结果972908.4292524.0172=⨯=nR 2112222015696.068528.17000924.0898427.1212.8915~X X X X e +-+-=12979624.8776473.5732.5042ˆX X Y ++-= ()55651.12- ()08121.38 ()364406.8999967.02=R 4.3 序列相关性检验4.3.1 进行序列相关性检验12979624.8776473.5732.5042ˆX X Y ++-=D.W.=0.302629,在5%显著水平下,n=17,k=3,查表得, 由于D.W.=0.302629 ,故存在正自相关。
02.1=L d 54.1=U d L d <4.3.2 序列相关性的拉格朗日乘数检验含1阶滞后残差项的辅助回归为:112~780037.1511165.1393119.17530.787~-+-+-=t t e X X e()495633.1- ()052539.3 ()718476.0- ()517359.6 771058.02=R336928.12771058.016=⨯=LM ,该值大于显著性水平为5%、自由度为1的2χ分布的临界值 ,由此判断原模型存在1阶序列相关性。
84.3105.02=)(χ含2阶滞后残差项的辅助回归为:()439786.1- ()041054.2 ()645818.0- ()247691.4 ()109071.0771285.02=R ,该值大于显著性水平为5%、自由度为2的2χ分布的临界值 ,仍说明原模型存在序列相关性,但 的参数未通过5%的显著性检验,表明不存在2阶序列相关性。
4.3.3 运用广义差分法进行自相关的处理569275.11771285.015=⨯=LM 99.5205.02=)(χ2~-t e 2112~070046.0~747584.1657454.1450818.11185.789~--++-+-=t t t e e X X e1阶广义差分的估计结果为)1(005346.154466.14693320.809.70995ˆ12AR X X Y t +++=()068456.0 ()014177.6 ()011144.4 ()57011.14 994266.02=R 992833.02=R 113450.2..=W D ,表明该模型已不存在序列相关性。