● 摘要
随着“金盾工程”的不断发展,全国警务工作信息化程度迅速提高。其中,北京市公安局的信息化工作更是走在了全国的前列。随着一系列警务办公信息化系统的引入,近年来,各级公安部门累积了大量数据,但目前对数据的利用仍停留在简单统计阶段,没有深入挖掘这些数据的价值。
针对传统的数据利用方式的局限性,本文根据公安部门工作中的实际需求,设计了基于多维模型的警情数据仓库。通过采用关联规则挖掘和分类预测算法对警情数据进行挖掘,得到警情数据中潜在的信息。最后,设计并实现了一个警情数据分析与挖掘系统,完成了基于数据仓库的警情数据分析、关联规则分析和发案热点预测,对科学部署警力、精确打击犯罪以及决策制定有重要意义。
本文的主要工作和取得的成果有:
(1)结合警情分析实践,基于数据仓库的多维模型设计了警情数据仓库,以此为基础对警情数据进行了切片分析、切块分析、TopN分析、趋势分析、对比分析和报表统计。
(2)基于Apriori算法设计了警情数据关联规则挖掘算法,并对关联挖掘结果进行了分析。针对Apriori算法在基于警情数据仓库进行数据挖掘时存在重复事务、无效候选项集和无效事务的问题,分别采用了事务聚合、抑制同维度项的连接和删除无效事务三种方法进行处理。
(3)基于最近邻算法设计了发案热点预测算法,并对预测准确度受时间和空间因素影响情况进行了研究,通过增加时间和空间限制,提高了热点预测的准确度。
(4)设计并实现了警情数据仓库的初始化系统以及警情数据分析与挖掘系统。主要实现了以下功能:1)警情数据仓库维度表的初始化,事实表的初始化及周期更新;2)警情数据分析及展示;3)警情数据的关联规则挖掘;4)发案热点预测。
相关内容
相关标签