当前位置:问答库>论文摘要

题目:公安交通管理系统中信息抽取技术的研究与实现

关键词:ITMS;信息检索;信息抽取;关联模式

  摘要

随着智能交通管理系统(ITMS)的不断完善,北京市公安交通管理局已经陆续建立了信号控制、交通综合监测、指挥调度、违法监测等数十个应用系统,每年形成的各类资源信息达到TB的数量级。为了实现交通管理中的“闭环管理”、“闭环执法”,北京市公安局交通管理局决定建设“交通数据综合分析与预报系统”,智能交通信息检索系统是其中的重要组成部分。为此,本文研究数据抽取技术,设计公安交通管理信息抽取系统,为检索提供数据基础。本文分析了ITMS中资源信息的特点和综合检索业务的需求,在研究了各种数据集成技术、数据抽取技术的基础上,设计了一套专用Schema结构来描述基础数据。针对ITMS中的关系型数据,定义了元数据对资源进行分类管理,制定抽取规则,进而装配SQL语句,最终实现数据抽取。针对以HTML网页为主的ITMS中的Web数据,采用了基于模板的信息抽取方案,通过为同类别的Web信息设计相应的模板,实现从Web页面中抽取数据的功能,模板能够灵活配置,具有较强的可维护性。对抽取后的数据,设计了一种顺序存储的文件格式进行统一存储和管理,并支持压缩存储,为异构数据对外提供统一的访问接口。同时,设计了文件缓存机制,优化信息抽取系统的I/O操作。为支持关联检索,根据交通管理的特点,特别是交通事件的特点,设计关联规则,建立数据间的关联模式。本文设计和实现了一套信息抽取原型系统,并利用部分数据进行测试验证,验证结果表明,系统能够实现对ITMS中异构数据抽取并对数据进行合理存储。