Vol20No2公路交通科技2003年4月JOURNALOFHIGHWAYANDTRANSPORTATIONRESEARCHANDDEVELOPMENT
文章编号:10020268(2003)02006305
收稿日期:20020525作者简介:任江涛(1975-),男,广西柳州人,清华大学博士研究生,研究方向为智能交通系统,信息处理交通状态模式识别研究
任江涛,欧晓凌,张毅,胡东成
(清华大学自动化系,北京100084)
摘要:在网络层次上进行区域交通信号控制、交通分配和路径诱导是缓解交通堵塞的有效途径之一。大量的实践经验
表明,无论是在城市交通网络,还是在高速公路网络中,网络的状态可分为数量有限且不同类型的模式,并且这些模
式不断重复出现。而针对不同的交通网络状态模式,可以通过理论分析或仿真研究等途径,求解用于进行区域信号控
制、交通分配及路径诱导的优化控制参数及控制策略。当系统识别出网络处于某种模式时,就可参照事先确定的优化
参数及策略进行交通控制和诱导,以缓解交通拥塞,提高交通系统的运行效率。本文基于对交通网络状态模式识别问
题及其应用的重要性的认识,应用模式识别的理论和方法,对交通网络状态模式识别问题进行了一些初步研究。
关键词:交通网络状态模式;模式识别;支持向量机
中图分类号:U49113文献标识码:A
PatternRecognitionofTrafficStates
RENJiangtao,OUXiaoling,ZHANGYi,HUDongcheng
(DepartmentofAutomation,TsinghuaUniversity,Beijing100084,China)
Abstract:Realtimenetworklevelsignalcontrol,trafficassignmentandrouteguidanceispromisingapproachesforalleviatingconges
tionBasedonourexperience,wecanknowthatalimitednumberofnetworkleveltrafficpatternsareoftenrecurrentnomatterinurban
trafficnetworks,norinhighwaynetworksDifferentoptimalsetsofcontrolparametersandstrategiesforareawidesignalcontrol,traffic
assignmentandrouteguidancecanbedeterminedaccordingtodifferenttrafficpatternsusingmanymethods,suchastheoryanalysisand
simulationBecauseoftheimportanceofpatternrecognitionofnetworkleveltrafficpatternintrafficcontrolandotherapplications,wedo
someelementaryresearchonthetopicbasedonthetheoriesandmethodsofpatternrecognitionarea
Keywords:Networkleveltrafficpattern;Patternrecognition;SVM
0引言
当前,智能交通系统的研究和开发越来越受到重
视,特别是随着信息技术在智能交通领域的应用和发
展,取得了越来越多的理论和应用成果。信息理论和
技术,如人工智能、模式识别、控制理论等,正广泛
地应用于智能交通系统的各个研究领域。
实时区域交通信号控制、交通分配和路径诱导是
缓解交通拥塞的有效途径之一。正是信息的采集、传
输、存储、分析处理及应用,实现了交通管理从简单
静态管理到智能动态管理的转变,从而实现了大交通
系统的动态优化运行,有效地满足了人们的交通系统
发展的需求。大量的实践经验表明,无论是在城市交通网络,
还是在高速公路网络中,网络的状态可分为不同类型
的模式,并且这些模式不断重复出现。而针对不同的
交通网络状态模式,可以通过理论分析或仿真研究等
途径,求解用于进行区域信号控制、交通分配及路径
诱导的优化控制参数及控制策略。当系统识别出网络
处于某种模式时,就可参照事先确定的优化参数及策
略进行交通控制和诱导,以缓解交通拥塞,提高交通
系统的运行效率。当前,对交通网络状态模式的研
究,正获得越来越多的重视。
为了有效地实现基于网络状态模式的区域交通信
号控制,文献[1]提出了基于人工神经网络的交通
网络状态模式聚类方法。在此研究中,一个拥有6个交叉路口和7个路段的简单路网作为研究对象,而
ART1网络则被用于实现对此网络在不同时段状态的
聚类分析,产生不同的模式。
文献[2]提出了一个基于案例推理的实时交通
流管理系统。实际上,此文所定义的案例等价于模
式。此系统通过对当前时刻与预测出的下一时刻的交
通流数据的分析,将不同典型的交通网络状态定义为
不同的案例(模式),然后针对不同的案例求解、存
储最优的交通分配策略于系统中。实验研究表明此系
统可实时运行,并取得了良好的效果。
交通模式的概念甚至可应用于交通流预测的研
究。例如,文献[3]提出了一种基于非线性时间序
列分析的交通流速度预测方法。虽然此文没有明确指
出,但此方法实质上利用了交通流速度时间序列模式
的相似性及反复出现的特性来实现速度预测的。
综上所述,交通模式的概念已逐渐成为交通研究
者的共识,并逐步成为研究中的热点问题。而对交通
模式的研究包含特征选择和提取、分类、学习和训
练、识别及预测等多个方面,本文主要讨论交通网络
状态模式识别问题。
1交通网络状态模式的定义
对交通网络状态来说,模式的定义和划分就是将
由多个不同的交通网络状态样本组成的集合划分为若
干个子集,并且这些子集具有一定的物理意义,目前
有2种方法。一类是基于先验知识的分类方法,即事
先知道样本的类别,也可视为有监督的分类,主要由
交通领域专家根据定性和定量分析,依据其经验实现
交通网络状态模式的划分,如是否发生交通事故就是
一个很强的模式划分标准;另一类为无监督的分类,
即采用样本间相似性度量将样本集自动划分为一定类
别的聚类分析方法,如文献[1]就采用自适应共谐
振神经网络实现交通网络状态的聚类。
聚类分析是根据特定的相似性度量将一个数据集
分成一定数目的子集,合理的聚类结果通常要求每个
类内部的数据样本具有较大的相似性,而不同子集之
间的数据相似性较小(数据样本的紧致性)。而对于
交通研究来说,就需要将不同时段的网络交通状态分
为若干个具有一定物理意义的类别。当前聚类分析方
法有很多,如C均值法、SOM、ART等,这些方法都
各有其优势和局限性。
分类的复杂性,在于没有纯客观的分类标准,因
为任何分类都是带有主观性的。模式识别是大脑中的
功能,其主观性是不可避免的。分类问题不单纯是数学问题,还需要一定的先验知识。而对于交通状态模
式的分类问题,由于分出的类别需要具有一定的物理
意义,而此物理意义在很大程度上是根据主观需要来
定义的。
因此,对交通状态模式分类,需要有监督分类方
法和无监督分类方法的结合。无监督分类方法过于依
赖特征提取和相似性度量的定义,一般没有结合专家
知识,而在一般情况下,结合专家知识对提高交通模
式的分类有效性是非常重要的。因为分出来的模式需
要具有一定的意义,以有利于进行交通信号控制和路
径诱导。而是否有意义,有什么样的意义,需要运用
交通领域的专业知识进行主观判断。而为了提高分类
的效率,首先应该进行无监督分类;在已分出类别的
基础上,再利用主观判断进行进一步的细分。
例如,通过对北京市某一路网1个月的交通流数
据的统计分析,并考察重点拥塞路段的空间分布,发
现这些重点拥塞路段主要集中在两个区域,即图1中
A和B。根据这个发现,可以建立如下的交通网络状
态模式定义准则:模式1,区域A和B同时拥塞;模式
2,区域A拥塞但B不拥塞;模式3,区域B拥塞但A不
拥塞;模式4,区域A和B都不拥塞。
图1路网及重点拥塞区域示意图
基于这些准则,就可以将此区域的交通网络状态
样本划分为各个具有一定物理意义的子集,从而形成
若干个交通网络状态模式类。
2交通网络状态模式识别
首先从模式识别的观点来看如何实现交通网络状
态的模式识别。模式识别的一般过程为特征选择和提
取、分类、学习和训练、识别和预测。下面结合交通
网络状态模式识别的具体特点和要求,分别就这些过
程进行简要的论述[5]。
特征选择和提取的基本任务就是从许多特征中找
出能最有效地实现分类和识别的特征。从交通网络状
态模式识别的角度来说,就是从车流量、平均车速、64公路交通科技2003年第2期车辆密度、道路占有率、排队长度、OD矩阵等可检
测到的交通量中选择,并采用一定的方法对这些交通
量进行变换和处理,如傅立叶变换、小波变换、主成
分分析等,使这些特征能最有效地实现交通网络状态
的分类和识别。在这里所要强调的一点是,虽然对特
征以及相应的变换进行选择的标准是一样的,就是最
有效地实现分类和识别,但具体到每个实际的识别问
题时,要根据不同的识别对象进行选择和评价,如识
别网络的拥塞与识别网络发生交通事故所用的特征及
其变换可能就不同。
分类就是实现对交通网络状态模式的分类,使这
些类别具有一定的物理意义,目前有2种方法如上节
所述。
学习和训练就是采用具有一定的推广能力的学习
机器对已知类别标签的样本进行学习,使该学习机器
具有一定的识别、分类乃至预测能力。当前人工智能
领域在这方面的研究成果很丰富,如模糊理论、人工
神经网络、支持向量机等。如文献[4]利用人工神
经网络实现对交通事故模式的检测,以及本文将要介
绍的采用支持向量机对不同模式下的交通网络状态进
行学习和训练。
最后,可以利用训练好的学习机器对新采集到的
交通网络状态特征样本进行识别,或是根据当前采集
到的交通网络状态特征样本以及各检测点交通流数据
的预测值对交通网络未来的状态进行识别和预测。根
据这些信息,就可参照事先确定的优化参数及策略进
行交通控制和诱导,以缓解交通拥塞,减少交通事
故,提高整个交通系统的运行效率。
3研究问题描述
在上一节,主要论述了交通网络模式识别的一般
过程,而作者所做的工作,则是这个一般过程的一个
子集,本节将进行详细介绍。
在本研究中,首先通过仿真产生一系列交通网络
状态样本。接着将网络状态分为若干个有意义的模
式,给每个样本加上类别标签,也就是基于先验知识
的有监督分类。然后进行特征提取和特征选择。接着
将样本分为两部分,其中一部分利用这些特征及相应
的类别标签对学习机器进行训练,最后应用此训练好
的学习机器对另一部分样本进行分类和识别,以检验
学习机器的性能和学习效果。图2总结了研究的流
程。图2研究流程图
4特征提取和特征选择
特征提取和特征选择是进行交通网络状态模式识
别的基础。在交通网络状态的模式识别时,可提取的
特征有车流量、平均车速、车辆密度、道路占有率、
排队长度、OD矩阵等等。在这里,选择车流量、平
均车速和车辆密度作为进行交通网络状态模式识别和
分类的特征量。
本文研究的对象是一个具有一定规模的交通网
络,而特征量的采集是基于一定的时间和空间的。从
时间上说,描述一个状态模式的原始数据应该是持续
一段时间,即包含连续多个时间点的数据;从空间上
说,则应该包含网络中各个路段所检测到的特征数
据。因此,如果不进行特征提取,即若不采用一定的
变换或映射的方法对原始特征数据进行降维处理,将
不得不面对一个高维的特征量,给处理和计算带来很
大的困难。在本文所描述的研究工作中,作者采用了
主成分分析方法进行交通网络状态模式的特征提取。
5学习和分类
学习和分类是进行交通网络状态模式识别的核心
问题之一,也就是要构造一个有效的学习机器,实现
模式的识别和分类。
传统的统计模式识别方法都是在样本数目足够多
的前提下进行研究,所提出的方法只有在样本数趋于
无穷大时其性能才有理论上的保证。而实际上,样本
数目通常是有限的。而近年来迅速发展起来的统计学
习理论是一种专门研究小样本学习的模式识别理论,
为研究有限样本情况下的统计模式识别和更广泛的机
器学习问题建立了较好的理论框架,同时也发展了一
种新的模式识别方法支持向量机,能够较好地解
决小样本学习问题。65交通状态模式识别研究任江涛等