● 摘要
随着专利制度的不断完善和发展,专利信息越来越来丰富,专利数据库的数据量越来越大,如何有效查找和利用专利信息就成为一个有待解决的问题。本文以中国农业科学院农业知识产权研究中心提供的专利数据为基础,设计并实现了一个专利检索与分析系统。实现系统主要需要解决检索速度与效果,分析结果的数据抽取与呈现两大问题。
本系统采用全文检索技术来实现专利数据的检索,基于Sphinx开源检索引擎构建了一个专利全文检索系统,在MMSEG中文分词算法的基础上,建立了一个分布式的索引文档库,并利用增量索引的方法实现了索引更新。通过全文检索技术,专利信息检索的速度有了很大提高,同在检索结果的合理排序方面也取得了良好效果。在专利分析数据呈现采用Amcharts组件与Raphael JS图形库来实现,图表直观、生动,取得了良好的呈现效果。
论文将采用软件工程的方法,从需求分析入手详细分析系统所需要的功能,接着从总体设计出发,介绍了系统所采用的总体解决方案,并以此为基础,对该系统的每个具体模块进行了详细设计,描述了各模块的工作流程。之后,对系统进行了测试,验证了系统功能,并通过性能对比测试得出,系统所采用的全文检索技术比传统数据库查询技术在速度和查全率上都有更好的表现。目前系统已经上线,并稳定对外提供服务,满足了用户对专利信息的检索需求和对专利情报的分析需求,达到了预期目标。
相关内容
相关标签