● 摘要
人类移动性研究一直是个备受关注且富有挑战性的课题,它对于城市规划、交通流量预测、市场竞争、 传染病预防和移动网络协议设计等方面具有非常重要的意义。过去由于采样手段的限制,获取的移动数据往往规模小、精度低,因此人类移动性相关研究的进展一直比较缓慢。近年来,各种移动定位设备(如手机、平板和GPS导航仪等)以及基于位置的在线社交服务(如Foursquare、Twitter和新浪微博等)在人们的日常生活中获得了广泛的应用。它们能够长时间、高精度地追踪记录海量的人类移动轨迹数据,这为研究人类移动性提供了必要的条件。正是受益于这些海量的移动数据,最近人类移动性研究已经取得了一系列重要成果。
本论文分别从人类移动性研究中的人类移动模式的实证分析、人类移动性建模和人类移动模式的相关应用三个方面展开研究:
(1)在人类移动模式的实证分析方面,对北京出租车乘客的移动模式进行实证分析。论文研究了乘客移动距离的统计特征,利用模型选择的方法发现移动距离不同于以往发现的幂律分布,而更符合指数分布。这里乘客移动范围局限在城市内以及出于经济因素的考虑都会对移动距离分布造成影响。此外,乘客的出行时间也同样服从指数分布,且出行时间和平均移动距离间存在近似线性关系。而出租车的载客间隔时间服从幂律分布,说明出租车的载客行为和人类某些日常活动一样具有突发的特征,这是由于城市内出行需求的周期性变化造成的。
针对城市内移动距离服从指数分布的现象,论文研究了这种现象产生的根本原因。首先,在四个城市的移动数据集中进一步验证了移动距离分布符合指数的现象;其次,发现起点约束的引力模型能够较为准确地模拟城市区域间的移动流量;再次,通过分析四个城市的人口分布情况,发现平均人口密度随到城市中心距离的增加呈指数衰减,而且平均人口密度和移动距离分布的衰减速率近似相等;最后,理论证明和实验模拟均表明人口密度分布的指数下降是造成城市内移动距离服从指数分布的根本原因。此外,在不同尺度空间下,人口密度分布函数形式上的差异(反幂或负指数函数)可能是造成移动距离分布不同(幂律或指数分布)的原因。这些结果表明移动距离分布只是人类群体移动的统计特征,并非个体移动模式的固有属性。
(2)在人类移动性建模方面,论文通过分析不同尺度空间下的移动数据,发现了一个普适的移动规律,即排名值为r的移动发生的概率反比于此排名值r。基于这个规律,论文提出了基于排名的群体移动模型。该模型是无参数的,适用于不同尺度空间下的移动流量预测。同时,模型形式非常简单,预测性能也比较稳定。更重要的是,它很自然地将移动性和社交关系联系起来。此外,该模型预测的移动流量结果只依赖人口的地理分布,这说明人口的分布情况可能是影响人类群体移动的主要原因。
(3)在人类移动模式的相关应用方面,研究了社交关系和移动性的相关性以及城市区域的划分方法。对于社交关系和移动性的相关性,分析了两个基于位置的在线社交服务网站,并量化了社交关系和移动性的相关性,显示出两者之间存在很强的正相关性。同时,根据基于排名的移动模型和社交网络的“小世界”性质,从理论上证明了两者间确实存在强相关性,并且符合实验分析结果。
对于城市区域的划分,提出利用地铁和公交站点对城市土地进行划分,获得最小土地单元;然后,根据移动流量建立关于土地单元的带权网络;最后,利用社团划分算法对带权网络进行划分,从而得到相应的区域划分结果。论文从北京出租车乘客的移动数据中提取了土地单元间的实际移动流量,发现利用Infomap社团划分算法能够得到粒度更细的划分结果,而且划分的区域也和直觉一致。此外,针对实际移动流量未知的情况,利用基于排名的群体移动模型预测移动流量,从而对城市区域进行划分。实验结果表明,这个划分结果与基于实际移动流量的划分结果有很高的相似度。
相关内容
相关标签