● 摘要
随着移动定位技术的迅速发展,人们能够收集规模庞大且特征丰富的城市时空数据,这为研究城市交通和居民出行特点提供了前所未见的大数据窗口。通过对这些时空数据的挖掘分析,不仅有助于理解居民出行特点,而且能够挖掘城市交通和区域功能结构中的规律,对城市规划和交通管理有重要的指导作用。论文分别从城市交通中的拥堵路段分析、城市的区域划分和海量时空数据的存储、计算及可视化方法三个方面展开工作。
(1)在交通拥堵分析方面,以北京市为例,论文通过拥堵识别发现二环易于拥堵,同时结合热点计算和文中提出的出行模型解释拥堵的原因,并使用微博数据验证。文中首先利用出租车GPS 数据,从路段级别检测北京市城区的拥堵情况,发现二环路段最易发生拥堵,而乘客的上下车位置分布则表明,二环周围聚集了大量的热点功能
区域。继而本文提出了车辆出行模型,用于模拟车辆选择行进的路线,并发现车辆在热点区域间通勤时经过二环路段的流量最大。这意味着二环路段最易拥堵是由城市功能区域分布导致的,其为连接热点区域的必经路段。同时,我们利用在线社交网络中的微博数据进一步验证了上述发现。此外,论文分析了城市扩张对城区交通压力的影
响,发现扩张会持续增加城内交通压力。
(2)在城市划分方面,论文基于出租车出行数据,提出了一种对城市范围内的区域(以北京市为例)进行行政和功能划分的方法,并使用不同时间的结果分析区域演化特点。首先,文中以路网切分城区得到区域单元并建立区域流量网络,继而利用两种较为流行的社团发现算法进行行政划分,发现Infomap 算法的结果更为合理。其次,文中基于区域单元的车辆出行时间建立其功能特征,使用谱聚类的方法对区域进行功能性划分,根据流量分布特点将北京市城区划分成三类:白天活跃、夜晚活跃、全天稳定。此外,通过比较不同年份的划分结果,论文发现由于城市的不断建设和发展,部分区域的结构和功能已出现明显变化,如在结构上表现为独立行政区域产生或与其他已存区域合并,而在功能上则或趋向多元或愈加单一。随着移动定位技术的迅速发展,人们能够收集规模庞大且特征丰富的城市时空数据,这为研究城市交通和居民出行特点提供了前所未见的大数据窗口。通过对这些时空数据的挖掘分析,不仅有助于理解居民出行特点,而且能够挖掘城市交通和区域功能结构中的规律,对城市规划和交通管理有重要的指导作用。论文分别从城市交通中的拥堵路段分析、城市的区域划分和海量时空数据的存储、计算及可视化方法三个方面展开工作。
(1)在交通拥堵分析方面,以北京市为例,论文通过拥堵识别发现二环易于拥堵,同时结合热点计算和文中提出的出行模型解释拥堵的原因,并使用微博数据验证。文中首先利用出租车GPS 数据,从路段级别检测北京市城区的拥堵情况,发现二环路段最易发生拥堵,而乘客的上下车位置分布则表明,二环周围聚集了大量的热点功能区域。继而本文提出了车辆出行模型,用于模拟车辆选择行进的路线,并发现车辆在热点区域间通勤时经过二环路段的流量最大。这意味着二环路段最易拥堵是由城市功能区域分布导致的,其为连接热点区域的必经路段。同时,我们利用在线社交网络中的微博数据进一步验证了上述发现。此外,论文分析了城市扩张对城区交通压力的影响,发现扩张会持续增加城内交通压力。
(2)在城市划分方面,论文基于出租车出行数据,提出了一种对城市范围内的区域(以北京市为例)进行行政和功能划分的方法,并使用不同时间的结果分析区域演化特点。首先,文中以路网切分城区得到区域单元并建立区域流量网络,继而利用两种较为流行的社团发现算法进行行政划分,发现Infomap 算法的结果更为合理。其次,文中基于区域单元的车辆出行时间建立其功能特征,使用谱聚类的方法对区域进行功能性划分,根据流量分布特点将北京市城区划分成三类:白天活跃、夜晚活跃、全天稳定。此外,通过比较不同年份的划分结果,论文发现由于城市的不断建设和发展,部分区域的结构和功能已出现明显变化,如在结构上表现为独立行政区域产生或与其他已存区域合并,而在功能上则或趋向多元或愈加单一。
(3)为了提高城市时空数据的存储和计算效率,论文基于Hadoop 和Hive 搭建了一个城市时空数据平台,包括城市时空数据的存储、计算及可视化内容。以出租车GPS 数据为例,根据常用的出租车类型将数据分层,建立采样点—道路—轨迹三层的数据模型,利用分布式的Hadoop 和Hive 的存储、计算框架,实现对海量城市时空数据的管理和使用,有效的降低开发成本,在提高效率的同时避免了大量重复的计算。此外,本文基于已有的数据平台分别在Web 端和桌面端实现城市时空数据的可视化,使挖掘到的关键模式更加直观形象,有益于新知识的进一步发现。