当前位置:文档之家› 数学建模大赛一等奖作品

数学建模大赛一等奖作品

数学建模论文高速公路道路交通事故分析预测摘要我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。

因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。

针对这样的现状,我们必须进行高速公路交通事故的预测,从而及早采取措施进行预防工作,从而减少事故发生次数及损失程度。

针对此次建模的要求,在对此问题的深入研究下,我们提出了合理的假设,将本问题归结为一个预测分析的问题,其基本思想是通过聚类分析、SPSS软件求解、GM(1,1)灰色预测模型、多元线性回归分析,组合模型等方法的运用得到最优的预测结果。

针对问题一,我们首先运用了聚类分析的思想,建立了基于聚类分析的模型Ⅰ,通过聚类分析方法对给定的信息的筛选、加工、延伸和扩展,从而将评价对象确定在某一范围内,通过了该方法,最终得到了各类评价等级方法,为科学预测交通事故提供了依据。

针对问题二,本文选取受伤人数这一单项指标作为预测的对象,首先运用了GM(1,1)灰色预测模型,建立模型Ⅱ,通过对给定的事故原始数据,通过MATLAB 软件预测了五年内的交通事故受伤人数;运用多元线性回归方法建立模型Ⅲ,在模型Ⅱ和模型Ⅲ的基础之上,通过基于组合模型思想的模型Ⅳ,求解得出了交通事故受伤人数在五年内的预测。

关键词:SPSS聚类分析GM(1,1)灰色预测模型组合预测模型MATLAB目录一.问题重述 (4)二.问题的分析 (5)三.模型假设与符号系统 (6)3.1模型假设 (6)3.2符号系统 (6)四.模型的建立及求解 (7)4.1 问题一 (7)4.1.1建立模型Ⅰ (7)4.1.2模型Ⅰ的求解及结果 (8)4.1.3实验结果的分析说明 (9)4.2 问题二 (11)4.2.1建立GM(1,1)模型Ⅱ (11)4.2.2 用MATLAB求解模型Ⅱ (16)4.2.3 建立模型Ⅲ (19)4.2.4 建立优化模型Ⅳ (20)4.2.5最优组合模型的求解 (21)五.模型的评价 (22)参考文献 (23)附录 (24)一.问题重述随着道路交通事业的发展,高速公路交通事故也在不断增加,对人类的生命和财产安全构成了极大的威胁。

我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高。

因此,改善交通安全状况、预防和减少高速公路交通事故具有重大的现实意义。

高速公路交通事故往往造成人员伤亡,车辆损毁、道路堵塞等严重后果,为探索高速公路道路交通事故发生的规律,分析现有道路交通条件下未来高速公路交通事故的发展趋势,以便及早采取措施进行预防,减少事故发生次数及损失程度,必须进行高速公路交通事故预测。

另外,高速公路道路交通事故分析预测是道路交通安全规划,决策及高速公路交通工程项目效益评价中的一个关键性问题,分析预测正确与否直接关系到高速公路交通设施的建设,高速公路交通管理政策的制定和高速公路交通建设资金的投资分配,具有重要的现实意义。

为了解决此问题,现利用已收集到的A省高速公路交通事故数据(见附件)、建立针对该省具体情况的数学模型,预测该省未来的交通事故情况,解决下面几个问题:1、目前国内外用于统计道路交通事故状况的四项绝对指标为交通事故次数、死亡人数、受伤人数以及直接经济损失,这四项统计指标既是认识交通事故的起点,又是构造其它交通事故统计指标的基础,基本涵盖了道路交通事故所造成各种损害的主要方面,因此选用这四项指标,试探讨以聚类分析作为理论基础的高速公路公路交通事故统计分析方法,然后从附件中所给A省高速公路交通事故四项指标的历史统计数据出发,对该省公路交通事故进行聚类分析研究,以期该省获得该省高速公路交通事故基于四项指标的时间、空间分布规律。

2、高速公路交通事故预测是高速公路安全评价、规划及决策的基础,国内外关于道路交通事故的预测有多种方法,鉴于高速公路交通事故具有复杂性、随机性和灰色性的基本特征,对高速公路公路交通事故预测时选用时间序列分析,灰色分析、神经网络等分析方法。

根据高速公路交通事故的分布规律,构建高速公路交通事故发生次数、死亡人数、受伤人数、直接经济损失的预测模型。

以A 省公路交通事故的历史统计数据为基础,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对A省公路交通事故未来五年的发展趋势做出科学预测,为高速公路交通安全管理部门提前预防和控制交通事故提供决策依据。

二.问题的分析2.1(问题一)本小问主要解决对该省公路交通事故四项指标进行的聚类分析。

此小问属于统计问题,因此由附件的相关数据信息,我们首先将附件中高速公路事故24时分布、月统计、辖区统计进行整理,得出四项指标在六年中小时段、月份、辖区分布总量。

本问题主要解决该省高速公路交通事故基于四项指标的时间、空间分布规律。

本问题为聚类分析的思想,由题目可以知道对于A省高速公路交通事故分布规律需要分别对四项指标进行聚类分析,找出各个指标内的能够度量不同小时段、不同月份、不同辖区之间的相似度的统计量。

并将其聚合到不同类中。

因此,用SPSS的K-means Cluster过程即逐步聚类法,按照预定的分类数量,按照既定的原则选择凝聚点,得到一个初始分类方案,并计算出各个初始分类的中心位置(均值);最后,使用计算出的中心位置重新进行聚类,因此在该方法中,各指标的分类情况会在运算中不断改变,分类完毕后再次计算各类的中心位置。

如此反复循环,直到凝聚点位置改变很小为止。

2.2 (问题二)由对题目的第二问分析,可知第二问分为两小问。

第一小问:选用灰色分析、多元线性回归分析等分析方法构建高速公路交通事故受伤人数预测模型。

交通事故作为一个随机事件,其本身具有相当大的偶然性和模糊性;具有明显的不确定性特征。

因此可以认为一个地区的道路交通安全系统是一个灰色系统,可以应用灰色系统的理论进行研究。

用G(1,1)灰色建立受伤人数指标的预测模型,在GM(1,1)模型及相关模型灰色预测过程中要大量进行数列和矩阵运算将MATLAB软件和GM(1,1)结合,实现灰色预测算法;建立多元线性回归模型。

第二小问:本小问为优化问题,就模型精度等级的划分和预测的准确性作进一步的分析,探讨建立组合模型或提高预测准确性的其它解决方案,最后对A 省公路交通事故未来五年的发展趋势做出科学预测。

对四项指标分别用灰色分析和多元线性回归模型结果进行精确度比较,并且构建最优组合预测模型。

利用以上两种不同的单项预测法对受伤人数指标进行预测,然后对各个单独的预测结果做适当的加权平均,最后取其加权平均值作为最终的预测结果。

本文采用简单实用的求方差极小值法,获得组合预测模型。

三.模型假设与符号系统3.1模型假设(1)假设在受伤人数统计时,以伤残等级三级以上归为受伤。

(2)假设在财产损失统计时,所损失的物资、费用等均按现社会流通价值或社会人力服务成本的平均值进行统计。

(3)根据其同一指标中的个体有较大的相似性,不同类中的个体差异较大,用聚类方法聚合时,将其聚合在3类中。

(4)假设高速路上行驶的车辆状况、驾驶员心理状态良好。

3.2符号系统X表示第i个指标在第j年的给定值;ijx实际给定的第k年的死亡人数:其中k=1,2,…6;()0(k)X)1(的一次累加生成序列;z)1(为X)1(的紧邻均值生成序列待定参数列;B为数据矩阵α,μ为待估参数;Y为数据向量;∧a为待定参数列;()k q为生成残差;q为残值均值;2s为原始数据的方差;12s为残值的方差;2C为后验差比值;P为小误差概率;f为组合模型使用;3f为多元线性回归预测值;2f为灰色理论预测值;12ε为多元线性回归预测的预测误差; 1ε为灰色理论预测的预测误差;2ω多元线性回归的相应权系数;1ω灰色理论模型的相应权系数; MSPE 为均方百分比误差;四.模型的建立及求解4.1 问题一4.1.1建立模型Ⅰ聚类分析法是根据实物本身的特性来定量研究分析问题的一种统计分析方法。

其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是更具一批样品的多个观测指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用聚类发将所有的样品(或变量)分别聚合到不同的类中。

将分析评价中的n 个待评样本作为聚类对象(Xi)(i=1,2,…,n);m 个;评价指标作为聚类指标(Uj )(j=1,2,…,m),s 个评价标准作为评价等级(Zk )(k=1,2,…,s).则根据第i 个聚类独享对于第j 个聚类指标的样本值X ij ,确定聚类样本矩阵为X :11121314152122232425313233343541424344455152535455X X X X X X X X X X X X X X X X X X X X X X X X X ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦以一年十二个月的数据分析为例:在对给定的原始收据通过Excel 整理的基础上我们建立了针对交通事故每月的聚类分析模型。

将分析评价中的12个待评样本作为聚类对象(Xi)(i=1,2,…,12);4个;评价指标作为聚类指标(Uj )(j=1,2,3,4),我们设定为三类分类标准,则聚类样本矩阵为:452641101239441275111301264022437525804535501263204463057977874493260108697455365812571015337619461245140551052758412643900581362736738204413146767496⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦4.1.2模型Ⅰ的求解及结果在建立了聚类分析的模型的基础上,我们采用了SPSS 软件来对模型进行求解,SPSS 的优点是计算量较小,从而可以有效的处理多变量、大样本数据而不会占用过多的内存空间和计算时间;同时在分析时用户可以人为地制定初始中心位置,或者将曾做过的聚类分析结果作为初始位置引入分析。

通过计算得得出下面的实验数据结果:表4.1初始聚类中心聚类1 2 3次数 45.00 45.00 36.00 死亡人数 26.00 35.00 27.00 受伤人数 41.00 50.00 36.00 经济损失 1012394.00 1263204.00 738204.00表4.2最终聚类结果 案例号 月份 聚类 距离 1 一月 1 2867.600 2 二月 1 114864.429 3 三月 3 180.068 4 四月 2 3051.507 5 五月 1 37387.572 6 六月 1 71712.429 7七月2 3051.5078 八月 1 69137.5729 九月 1 37496.43010 十月 1 114680.57211 十一月 3 14556.00112 十二月 3 14736.001表4.4每个聚类中的案例数聚类 1 7.0002 2.0003 3.000有效12.000缺失.0004.1.3实验结果的分析说明(1)表2.2显示的是将样品分为三类的聚类结果,这三类分别是:一月、四月、十一月。

相关主题