当前位置:文档之家› 基于多机器学习竞争策略的短时交通流预测

基于多机器学习竞争策略的短时交通流预测


Prediction of Short-term Traffic Flow Based on Ensemble Learning Mechanism
XU Jian-feng1,2, TANG Tao1, YAN Jun-feng1, LIU Zhen3
(1. School of Software, Nanchang University, Nanchang 330047, China; 2. School of Electronic and Information Engineering, Tongji University, Shanghai 201804, China; 3. School of Computer Science, Beijing Jiaotong University, Beijing 100044, China)
近年来,许多学者已经提出了一些短时交通 流量预测的预测模型.例如文献[1]提出小波分析 的支持向量机预测模型,模型首先对交通流量进 行小波分解,使交通流量平稳化,得到交通流量信 号的高频和低频部分,采用支持向量机进行预测, 最后将高频和低频部分的预测结果采用小波重 构,获得最终预测值.文献[2]认为交通状态中存在 混沌,该文运用混沌与分形理论恢复交通流量序 列的动力学系统,并用多元局域预测法对时间序 列进行预测,并实地采集数据运用模型进行分析 校验,取得了较高的预测精度.文献[3]针对短时交 通流量预测中的不确定信息难题,提出了一种基 于贝叶斯网络的多方法组合预测模型,其预测精 度优于单一的预测模型.
| | a ={t ,t ,t ,…,t } ij
(aij , 1)
(aij , 2)
(aij , 3)
(aij , h)

aij ∈ Ai
、 aij
=h

t(aij,k + 1) 与 t(aij,k) 之间满足前驱后续关系.
Vi ={TSi1,TSi2,TS ,i3 …, TSim} 代表第 i 交通道
条交通道路监测的交通流量信息构成的交通流量
时间序列信息系统,记为 Di = ( Ai,Vi,Ni,F,g) .
{ } 其中 Ai = ai1,ai2,⋯,aim 代表第 i 条道路内 m
个具有时间先后顺序的交通流时序段构成的集
合,每个时序数据段的长度为 h 个时间单元.即对
第 i 条道路的第 j 个时间窗口的数据表达为
(aij
,
1)öø÷,
f
æçt è
(aij
,
2)öø÷,
⋯,
f
æçt è
(aij,
ö h)ø÷
数据样本 Di 对应的时间序列 Vi 集合可以记 为交通局部时序数据矩阵模型 Vi 如式(1)所示.
第 16 卷 第 4 期
基于多机器学习竞争策略的短时交通流预测
187
Vi
=
éTSi1ù ëêêêTT⋮SSii2mûúúú
路监测的流量数据样本中的 m 个前驱后继的交通
流量时间序列数据构成的集合.
{ } { Ni =Fra bibliotekNik1,
Nik2,
⋯,
Nk im
代 表 Vi = TSi1,TS , i2
TSi3,…,TS }im 中每段历史交通流量时序数据之后的
连续 K min 内交通流量取值的集合(特征值可以是
流 量 、平 均 速 度 或 其 它 指 标),其 取 值 由 映 射
(即 V1,V2,V3,⋯,Vl ),按照每段时间序列的起始时 间的先后顺序组合转换成一列数据.最后将需要预
测的第 i 条道路的各个时间窗口未来 k min 交通流
量值 Ni = {Ni1,Ni2,k,…, } Nim 加入到相应时间段,作
为相对于第 i 条道路预测的一列决策数据.得到如
第16卷 第 4 期 2016 年 8 月
交通运输系统工程与信息 Journal of Transportation Systems Engineering and Information Technology
文章编号 :1009-6744(2016)04-0185-06
中图分类号 :U491.2
Vol.16 No.4 August 2016
作者简介:徐健锋(1973- ),男,江西南昌人,副教授,研究生导师,博士生.
*通信作者:jianfeng_x@
186
交通运输系统工程与信息
2016 年 8 月
0引言
21 世纪以来,各国城镇化及家庭汽车急剧增 加.尽管这些给人们出行带来了便利,但由于交通 基础设施的发展速度无法赶上私人汽车的发展速 度,交通拥堵问题越来越突出,交通事故也日益增 多.以短时交通流量预测为核心的交通智能诱导技 术越来越成为未来智能交通的热点问题之一.
ù ú úú
⋮ úú
f (t(aim,h))ûú
(1)
式中:每一行表示为对应 TSij 数据集合的 h 个数据
的水平转置.
由于各道路之间的交通流量会相互影响,因此
不直接使用单条道路的历史流量数据来预测未来
流量,而是对该道路及其邻近道路历史数据进行建
模.将 D 集合中 L 条道路的交通局部时序数据矩阵
=
éF(ai1)ù ëêêêFF⋮((aaii2m))ûúúú
=
é ê êê
f f
(t ) (ai1,1) (t ) (ai2,1)
êê ⋮
ê ë
f
(t(aim,
)1)
f (t(a ),2) i1
f (t ) (ai2,2)
⋮ f (t ) (aim,2)
… …

f f
(t ) (ai1,h) (t ) (ai2,h)
的 多 条 道 路 作 为 研 究 对 象 ,并 提 出 了 基 于 集 成 学 习 思 想 的 混 合 多 机 器 学 习 [10-12] 策 略 的 交 通 流 量预测模型.本模型将交通流量预测看作多维时 间序列数据挖掘.
1 多维时序交通流量数据分析
本研究的实验对象选取的是电子警察测速仪
采集的各个道路主要路段交通车流量数据.每条道
路采集的原始信息以车辆为单位,包括道路编号,
牌照、到达时间、离开时间等.首先对各道路每分钟
车流数量进行统计,并将交通流量数据按一定时
间长度进行统一的窗口切分.最后将流量的度量离
散为不同级别.
指定某区域内 L 条交通流量数据的集合设
{ 为 D = D1,D2,⋯, DL} ,且 Di ∈ D 的语义为 D 中第 i
g:TSij

Nk ij
决定,其中
j ∈{1,2,⋯,m} .
F 是一个映射,F:aij → Tij ,其语义为 Vi 中的
任意第 j 段时间序列数据 TSij 与 Ai 中的第 j 段时
序 数 据 段 aij 的 一 一 映 射 关 系. 可 记 为
( ) { } Tij = F aij =
f
æçt è
可以看出,上述研究往往都是以被预测道路 自 身 的 数 据 作 为 研 究 对 象 进 行 分 析 和 建 模 ,而 临近道路之间的交互影响一般都较少研究.但 是 ,同 一 区 域 内 的 多 条 道 路 之 间 的 交 通 流 量 显 然 具 有 一 定 的 关 联 性 ,因 此 本 研 究 以 同 区 域 内
Abstract: Short- term traffic flow prediction is an important issue of traffic- oriented big data application. Traditionally, traffic flow prediction is determined by the local recordings, whereas the natural relations of adjacent roads are neglected. Based on the characteristic of downtown traffic flow, a multi-dimensional data model concerning relevant roads is proposed. Meanwhile, a multi- machine learning competing strategy is developed. The essence of proposed prediction strategy is training commonly used machine learning algorithms independently with the clustered temporal information as input. By selecting high prediction performance as dominating weak classifier, the weight is further assigned to corresponding algorithm so that a strong classifier is eventually developed. As a result, the traffic flow prediction problem is converted to a weighted multi- machine learning problem. Experiments on downtown streets of Nanchang show that the superiority of proposed method as compared to traditional single time series based solutions. Keywords: urban traffic; traffic flow; machine learning; ensemble learning; time series
相关主题