当前位置:文档之家› 数学建模之火车客流量预测

数学建模之火车客流量预测

目录铁路旅客流量预测客 (1)摘要 (1)一.问题重述 (1)1.1引言 (1)1.2问题的提出 (2)二.问题分析 (2)2.1根据不同的限制条件整理数据,分析数据的分布 (2)2.2利用问题一中的结论,建立数学模型 (2)三.模型假设与符号说明 (2)3.1.1模型假设 (2)3.1.2符号说明 (2)3.2.1模型假设 (3)3.2.2符号说明 (3)四.模型的建立与求解 (3)4.1.1 数据分析处理 (3)4.1.2利用信息增益的计算公式求出各个特征属性的信息增量 (4)4.1.3 根据图表分析在不同的特征属性内部客流量的变化规律 (6)4.1.3.1按车的种类分析 (6)4.1.3.2按站点分析 (7)4.1.3.3按时段分析 (8)4.1.3.4按区间大小分析 (8)4.2.1灰色预测 (9)4.2.2问题分析与准备 (10)4.2.3预测模型的建立 (13)五.模型的优缺点 (14)5.1 优点 (14)5.2 缺点 (14)六.参考文献 (15)七. (15)八.附录 (16)铁路旅客流量预测客摘要铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率具有重要的意义。

影响客流量的因素有很多,例如车次,时间,车站,区间,天气,节假日等。

现在我们分析前四个因素对客流量的影响,我们首先引用信息熵概念来计算具体哪个因素对客流量的影响最大,并通过ID3算法生成决策树,根据所得生成树可以快捷方便的分析客流量规律。

在对原始数据进行研究分析后,车站对于客流量的影响最为显著,于是将车站这个因素选定为了主要变量,然后从这个主要变量着手,核心思想是通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化,这种模型对于挖掘和利用原始数据有很好的帮助,同时参考了在问题一中所得出的客流量的一般规律,最终采用累减生成的放松得到了一组灰色序列以弱化数据的随机性和预测未来客流量。

关键字:信息熵ID3算法灰色预测模型一.问题重述1.1引言随着《关于改革完善高铁动车组旅客票价政策的通知》的发布,高铁动车票价将根据市场情况自行定价。

铁路部门为了保持市场的竞争力,实现利润最大化,需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路的体情况,而其中对客流的预测是准确把握市场的首要条件,因此铁路客流预测的研究也成为铁路客运服务需要重点研究的方向。

然而铁路客流量受多种因素的影响,比如:“春运”期间铁路客流量骤增,导致铁路运力无法满足客户乘车需求,同时也给铁路客运组织带来巨大压力。

在非节假日期间,一些冷门线路区间上座率不足,造成铁路车辆资源的浪费。

因此铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率要的意义。

11.2问题的提出针对该铁路公司的ZD190(站)至ZD111(站)区段的客运专线完成以下任务:(1)根据附件1,按车次、时段(小时)、车站、区间(两个车站之间)等条件分析客流规律。

(2)考虑相关因素的影响,构建客流量预测模型,并预测未来两周的客流量。

二.问题分析2.1根据不同的限制条件整理数据,分析数据的分布首先整理数据,剔除多余数据只留下ZD190至ZD111之间的客流量信息,统计客流量数据并整理出平均值,制作出一张主表。

之后根据主表分别以车次,时段,车站,区间等条件划分客流量制成四张分表,根据分表的信息,引用信息熵等概念具体分析具体哪个条件对客流量的影规力较大,并通过观察与数据统计分析在分别以车次,时段,车站和区间划分数据时客流量的分布规律。

2.2利用问题一中的结论,建立数学模型在认真分析了第一问中得出的客流规律以后,考虑到铁路客流量问题中一部分信息是已知的,另一部分是未知的,且系统内各部分因素间关系具有不确定性这些特点,建立灰色系统预测模型,通过一些基本假设的建立来简化现实铁路系统中较为复杂的各种情况,通过鉴别节假日、周末、平时的不同车次、时段、车站、区间之间发展趋势的相异程度综合考虑各种如各车站里程、区段各站点气象等现实条件的影响,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,以此来预测未来两周的客流量。

三.模型假设与符号说明3.1.1模型假设1.通过信息熵公式求得不同条件的信息熵。

2.实际情况与模型的情况相同。

3.1.2符号说明23.2.1模型假设1.假设天气不影响客流量。

3.2.2符号说明四.模型的建立与求解4.1.1 数据分析处理34.1.2利用信息增益的计算公式求出各个特征属性的信息增量在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。

在认识信息增益之前,先来看看信息熵的定义。

熵这个概念最早起源于物理学,在物理学中是用来度量一个热力学系统的无序程度,而在信息学里面,熵是对不确定性的度量。

在1948年,香农引入了信息熵,将其定义为离散随机事件出现的概率,一个系统越是有序,信息熵就越低,反之一个系统越是混乱,它的信息熵就越高。

所以信息熵可以被认为是系统有序化程度的一个度量。

假如一个随机变量的取值为,每一种取到的概率分别是,那么的熵定义为4意思是一个变量的变化情况可能越多,那么它携带的信息量就越大。

对于分类系统来说,类别是变量,它的取值,而每一个类别出现的概率分别是这里的就是类别的总数,此时分类系统的熵就可以表示为信息增益是针对一个一个特征而言的,就是看一个特征,系统有它和没有它时的信息量各是多少,两者的差值就是这个特征给系统带来的信息量,即信息增益。

由上表可知对客流量影响最大的因素由低到高的排序为:车次种类,区间,时间段,车站。

54.1.3 根据图表分析在不同的特征属性内部客流量的变化规律4.1.3.1按车的种类分析由表可知D和G系列车的日均客流量较大,K系列车日均客流量相对较小,而Z和T系车的日均客流量非常小。

6由表可知ZD111车站的日均客流量最大,ZD326,ZD250,ZD062,和ZD190车站的日均客流量较大,而ZD192,ZD311,ZD121,ZD022,ZD120,ZD370和ZD143车站的日均客流量非常小。

7由表可知客流量主要集中在4:00-20:00,其中的大多数客流量分布在8:00-16:00,而0:00-4:00和20:00-24:00的客流量非常少。

4.1.3.4按区间大小分析8由表可知大多数乘客都会选择路程大于4站的的列车,而选择路程小于等4站列车的乘客很少。

4.2.1灰色预测灰色系统是指部分信息已知,部分信息未知的系统.灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模.由于生成的模型得到的数据通过累加生成的逆运算――累减生成得到还原模型,再有还原模型作为预测模型。

预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。

灰色预测模型建立过程如下:(1)设原始数据序列X0有n个观察值,X0={X0(1),X0(2),...X0(n)},通过累加生成新序列X1={X1(1),X1(2),...X1(n)},利用新生成的序列X1去拟合函数曲线。

(2)利用拟合出来的函数,求出新生成序列X1的预测值序列X1’。

(3)利用X0(k)=X1(k)-X1(k-1)累减还原得到灰色预测值序列:X0={X0(1),X0(2),...X0(n+m)}。

将序列X0分为Y0和Z0,其中Y0反应X0的确定性增长趋势,Z0反映X0的平稳周期变化趋势。

利用灰色GM(1,1)模型对X0序列的确定性增长趋势进行预测。

94.2.2问题分析与准备在问题一中得出了客流量的一般规律,下面将几个变量分开重新研究一下它们各自对客流量的影响,这三个影响因素分别是车站站点、时间段以及车次.在建立模型时不可能也没有必要考虑所有因素,只需考虑关键因素,进行合理的假设和模型构建。

通过控制变量法,分析三个主要影响因素与客流量的关系,结合原始数据绘制了表图如下。

101112由题一可知相较于车次和时间段,车站站点对于客流量的影响更加显著。

因此接下来我们就以车站为主要变量建立灰色预测模型来对原始数据进行分析以实现对未来两周客流量进行预测的目的。

4.2.3预测模型的建立基于以上的分析,我们以车站为主要变量,建立灰色预测模型。

原始数据如下:车站数n=12平时上车X(1)0={4144,0,469,3641,1003,113,1380,111,55,48,0,1707} 平时下车Y(1)0={10722,1568,598,9906,1963,137,1793,167,139,79,0,3938} 周末上车X(2)0={6407,0,802,4123,1219,131,1532,91,56,38,0,2825} 周末下车Y(2)0={12599,1627,932,10177,2240,155,1903,141,156,77,0,4906} 构建灰色预测模型为核心思想的模型并得出了以下未来两周客流量的预测结果:未来平时上车13X(1)1={4144,174,211,255,308,373,547,661,801,969,1173,1419}未来平时下车Y(1)1={10722,940,1094,1273,1481,1723,2332,2713,3156,3672,4272,4970 }未来周末上车X(2)1={6407,150,189,239,302,381,608,769,971,1227,1549,1957}未来周末下车Y(2)1={12599,567,677,808,964,1150,1638,1954,2332,2782,3320,3962}五.模型的优缺点5.1 优点(1)本文很好地利用了EXCEL 的数据处理功能,对附件一中提供的大量数据进行了整理分析。

(2)我们绘制了大量表图,使得客流量的规律能够具有一个很好的可视化展现。

5.2 缺点由于我们能力有限,对一些较为重要的变量弱化甚至是忽视性的处理,这样大大影响了预测结果的实用价值。

14六.参考文献[1] Thomas H.Cormen、Charles E.Leiserson等编著,Introduction to Algorithms,机械工业出版社,2006;[2] Floyd算法,百度百科/view/14495.htm[3]边馥萍、侯文华、梁冯珍编著,数学模型方法与算法,高等教育出版社,2005.5;[4] Anthony, R. N. Planning and control systems: a framework for analysis[J]. Harvard University,Boston, 1965.15八.附录预测未来两周客运量的程序代码:A = [4144,0,469,3641,1003,113,4928,1380,111,55,48,0,1707,9255]; B= zeros(1,14)B(1,1)=A(1,1);for i = 2:14B(1,i) = A(1,i)+B(1,i-1);endC=zeros(13,2);j = 1;for k=1:13C(k,j) = -1/2*(B(1,k)+B(1,k+1));endj =2;for k =1:13C(k,j) =1;endD=zeros(1,13);for l = 1:13D(1,l) = A(1,l+1);endM = inv(C'*C)*C'*D'a = M(1,1)%baihuaxihuab =M(2,1)H=zeros(1,28);H(1,1) =A(1,1);for f = 1:2716。

相关主题