廊坊师范学院
《数据挖掘》课程论文
题目:国内游客总人数的时间序列分析学生姓名:xxx
任课老师:曹慧荣
院别:数学与信息科学学院
系别:信息与计算科学系
专业:信息与计算科学
年级:2011级本科1班
学号:xxxxxxx
完成日期2014年6月18日
数据挖掘本科生课程论文
论文题目:国内游客总人数的时间序列分析
摘要:研究的问题:通过对国内游客总人数的变化研究,研究各年人数的变化规律,挖掘有价值的信息.研究的方法:时间序列分析与预测,建立霍特双参数指数平滑模型,对历年的旅游总人数进行分析.得到的结论:旅游人数逐年上升,中国旅游业的前景非常的可观,中国旅游产业发展到一个新阶段,同时也从侧面反映了人们的物质生活条件的提高.
关键词:旅游总人数;时间序列;预测;霍特双参数指数平滑模型.
Title:Time Series Analysis of the Domestic Total Number of Visitors
Abstract:Research: Through the study of changes in the total number of domestic tourists, the number of studies each variation, the excavation of valuable information. Methods: Time series analysis and forecasting, establish Holt two-parameter exponential smoothing model, the total number of tourists over the years analyzed. The conclusion: the number of tourists increased year by year, the prospects of China's tourism industry is very impressive, China's tourism industry to a new stage, but also from the reflection of the improvement of people's material living conditions. Keywords:The total number of tourist;Time series;Forecast;Holt two-parameter model.
1.引言
随着社会的发展,旅游业已成为全球经济中发展中势头最强劲和规模最大的产业之一,日益凸显它在国民经济中的重要地位.旅游业的发展以整个国民经济发展水平为基础并受其制约,同时又直接或间接地促进国民经济有关部门的发展.旅游业的发展经济、社会效益明显,能够促进促进我国产业结构调整和优化,为社会提供大量就业机会,提高人们的物质文化生活水平,在增进国际交流的同时促进招商引资,加快社会主义新农村建设步伐,以及促进经济与环境和社会的协调发展.
2. 霍特双参数指数平滑模型 方法
此模型适用于有线性趋势但没有季节性的序列.针对这种情况 ,霍特提出了对数列的水平和趋势值分别进行平滑 ,然后用这 2 次平滑的结果进行线性外推预测的方法 .霍特双参数指数平滑法使用 2个平滑参数(均在 0~1之间取值 )和 3个方程式 :
^()()(1)((1)(1))
()(()(1))(1)(1)()()()
t L t Y t L t T t T t L t L t T t Y k L t kT t =α+-α-+-=γ--+-γ-=+
这里,L(t)称为数据平滑值,T(t)为趋势平滑值.在简单的指数平滑中,第t+1期的估计值是第t 期的观察值与第t 期估计值的加权平均.如果序列有趋势,L(t)和L(t+1)之间就存在趋势差T(t).当序列呈上升趋势时,L(t+1)会低于实际值,当序列呈下降趋势时,L(t+1)会高于实际值.因此,霍特的方法是一种改进,在估计L(t)时,给L(t-1)加上一个趋势增量T(t-1),解决了估计值的时间滞后问题.这里的这个趋势增量也是一个指数平滑估计值:第t 期的趋势估计值T(t)是第t-1期的趋势估计值T(t-1)与这两期估计值之差L(t)-L(t-1)的加权平均值,也即是用第t 期与t-1期趋势平滑之差来修正第t-1期的趋势值.
3.国内旅游总人数的时间序列分析
数据源:中华人民共和国国家统计局: .cn/workspace/index;jsessionid=10F141EDD473DB4CDA5A1123471F9209?m =hgnd
关于中国近20年的旅游总人数的统计.
说明:数据的变量包括两个,一是年份,二是每年对应的国内游客(百万人次),利用时间序列分析与预测,分析1994年到2012年这19年的数据,预测2013年到2016年这四年的旅游人口变化.
分析流程:
1. 将“数据源”中的Excel 节点添加到数据流区域,将“国内旅游总人数”加载到该
节点,在“类型”标签下,把“年度”的方向设置为“无”,“国内游客(百万人
次)”的方向设置为“输出”.
2.添加“时间区间”节点,建立连接,将“时间区间”的间隔改为“年”,在“预报”
标签下,勾选“将记录扩展至未来”,预测期数为“4”.
3.建立时间序列散点图,将序列选定为“国内游客(百万人次)”,其他默认,单击
“执行”,得到如下散点图.
4.将“时间序列”节点添加到数据流中,选择“指数平滑”方法,选择Holts线性趋
势,其他默认即可.得到如下图结果
5.从图中可以看出,残差序列的自相关系数全部落入95%置信区间内,说明残差序
列是随机序列.
6.将“时间散点图”节点添加到数据流中,得到预测与期望值的时间散点图
7.在输出结果中,表中的最后4行是对未来四年的预测值,即
结论分析:随着旅游总人数的不断增加,我国旅游产业已经形成规模,旅游产业支柱作用也更为强化,旅游产业在质和量上将持续发展,旅游资源多向度开发,并且旅游产业发展的机遇与挑战并有.
旅游产业国内旅游市场、入境旅游市场、出境旅游市场运行良好.市场上的旅游人次、总收入、人均旅游消费支出都呈上升趋势.旅游产业市场跻身世界前列.世界旅游组织对我国旅游产业的发展给出了非常高的预期,其预测为:到2015年时,在世界旅游目的地中,我国将位列第一;在世界旅游客源国中,我国将位列第四;而我国旅游产业的增长速度也明显快于世界上其他主要国家的旅游产业增长速度.
旅游产业的支柱作用得到体现.旅游产业由于在我国社会经济中的作用日益突出,他的发展已经被我国列入了国名经济和社会发展计划.国家旅游总局于1995年和2000年分别制定了《中国旅游业发展“九五”计划和2010年远景目标纲要》、《中国旅游业发展“十五”计划》.各个省、自治区从各自的旅游资源优势出发,将旅游产业作为当地经济优势产业和重要产业,其中10多个省份将旅游产业定为支柱产业,7个省份将旅游产业作为重要产业和先导产业,6个省份将旅游产业作为第三次产业的先导产业和龙头产业.
参考文献
[1]熊平.数据挖掘方法算法与Clementine实践.清华大学出版社,2011.4 ISBN 978-7-302-23501-9
[2]陈封能,斯坦巴赫,库马尔著范明,范宏建译. 数据挖掘导论. 人民邮电出版社,2011.1 ISBN 9787115241009
[3]张良均,陈俊德,刘名军,陈荣著. 数据挖掘:实用案例分析. 机械工业出版社,2013.7 ISBN 9787111425915
附录A:论文中用到的数据
年份国内游客(百万人次) 1994年524 1995年629 1996年640 1997年644 1998年695 1999年719 2000年744 2001年784 2002年878 2003年870 2004年1102 2005年1212 2006年1394 2007年1610 2008年1712 2009年1902 2010年2103 2011年2641 2012年2957
附录B:自评成绩及论述:
我的论文在以下几个方面给出了相关的分析:
1.旅游总人数的时间序列分析与预测;
2.霍特双参数指数平滑模型的建立;
3.未来四年国内旅游人数的走势.
所以本人认为本人论文成绩为80分
10。