当前位置:问答库>论文摘要

题目:公安信息应用资源管理系统中检索服务的研究及应用

关键词:元数据;混合索引;查询和匹配;检索系统评测

  摘要

为了解决公安专网内查找信息困难和资源利用率低的问题,公安部建立了“主目录服务及公安信息应用资源管理系统”。各类资源信息按照元数据规范提取,存储于以组织机构隶属关系组织的目录服务系统中。公安信息应用资源管理系统完成对各类资源元数据的维护,为用户提供资源信息的快速查找定位服务,此外,还具有对各类资源使用情况进行统计分析的功能。本文所研究的检索服务系统是对存储于目录服务中的信息资源元数据进行分析处理,生成索引,在此基础上提供以关键字搜索方式实现的资源快速查找及定位服务。本文研究了公安信息应用资源元数据的特点,给出了公安信息应用资源元数据索引及检索方法。首先,结合公安信息应用资源元数据结构性特点,给出了含有结构信息的索引文件格式。然后,结合公安用户查询特点,为了保证查全率和查准率,提出了词字混合索引方法。为了在词与字相结合的索引中获取结果,研究了用户查询输入处理方式。此外,为了体现元数据中不同结构部分的不同重要性以及关键词与关键字的不同重要性,对其权重的设定进行了分析。在查询过程中,还涉及到结果集合的获取,相关度计算,结果排序及显示,本文对这些问题也做了深入分析研究。随后,在开源检索工具包Lucene 的基础上实现了公安信息应用资源检索服务系统。本系统在实现时分为两大模块:索引和检索。索引部分完成对存储于目录服务中的每个信息资源元数据提取生成文档,并分析生成索引。检索部分提供用户接口接受用户查询,然后在索引中查找,将符合条件的文档按照与查询的相关度排序输出。同时,在显示结果的过程中将文档中和用户查询关键词匹配的部分高亮显示。最后,借鉴TREC及中文WEB信息检索评测,对本检索系统做了测评,并对实验数据做了相应分析,指出了本系统的特点。