● 摘要
交通拥堵来源于人们日益增长的交通需求,却又反过来极大地影响着交通体验,交通流理论便是为了解决这一矛盾而兴起的。随着车载传感器普及越来越广,采集得到了大量粗糙的交通数据,这些数据不能满足传统交通流理论对数据精度的要求,却可用于数据挖掘、机器学习领域内的算法,为交通流研究带来了新的机遇。本文使用出租车轨迹数据检测并分析异常交通流,正属于这一类新兴的尝试。
异常交通流和交通拥堵不尽相同,异常交通流指的是某一交通特性超越了该特性演变规律的交通流。从这一角度着手进行异常交通流检测,必须要解决三个问题:考察哪些交通指标;何以表示道路交通流规律;如何衡量异常程度。
本文从出租车辆轨迹数据的特点出发,认为最合适作为评判异常的交通指标为交通流量。仅由出租车轨迹数据统计得出的交通流量含义过于单一,缺乏其背后的道路信息,又缺乏全体车辆的流量信息,因此,本文将这些隐含的信息融合于道路车辆负荷度这一概念中,并用道路的车辆负荷度代表交通流状态,同时,使用泊松混合模型表示出租车流量和车辆负荷度之间的关系。
本文从元胞自动机微观交通流模型及其假设得到启发,认为道路的交通流状态可视为元胞,相邻道路的交通流状态按一定规律互相影响,并基于此提出了耦合隐马尔可夫道路交通模型(Coupled Hidden Markov Model for Road Traffic,CHMM-RT)。模型中每条道路都对应有一个隐藏状态变量和一个观察变量,观察变量是道路上统计得到的流量值,隐藏状态变量是道路的车辆负荷度。道路流量条件独立于道路的交通流状态,而且相邻道路之间存在交通流状态相互影响的概率关系。由于耦合隐马尔可夫模型不存在多项式时间的精确求解算法,本文从交通场景的特点出发,在模型中加入了线性假设,并提出了一种新的求解该模型最大似然参数的启发式算法,该算法拥有较高的时空效率。最终,使用该模型得到的流量似然度作为判断异常程度的标准。
本文使用真实的出租车轨迹数据验证了CHMM-RT学习算法的收敛性,并针对模型的交通流预测能力、异常检测能力进行了实验验证。之后,使用在真实出租车轨迹数据中检测得到了异常交通流,分析了异常发生的时间分布,以及流量异常时和预估流量的差值。实验结果表明,异常主要发生于7时至24时,而且白天检出的异常流量一般低于预估流量,这是因为出租车司机会避开拥堵,造成热点道路上出租车流量过低。最后,为了研究异常交通流在道路网络中的动态演变规律,本文将检出的异常流在时空域内加以扩展,得到异常网络,使用网络分析的方法研究异常的演变规律。从构建得到的异常网络中,本文发现了和出租车会有意避开拥堵路段的现象,还发现了部分信息点(Point of Interest,POI)对交通的影响。