当前位置:问答库>论文摘要

题目:基于位置的生活服务型垂直搜索引擎的设计与实现

关键词:垂直搜索引擎,面向生活服务,基于位置,定向爬虫,倒排索引

  摘要



随着时代的发展,人们对基于位置的服务的需求越来越迫切,千篇一律的通用搜索方式已经不能满足用户的需要。在这种背景下,论文针对网络信息发展现状和搜索引擎发展的不足,指出了垂直搜索的概念和研究的必要性,对垂直搜索引擎进行理论性分析,并从实践的角度介绍了系统实现的关键技术,阐述了系统的具体实现过程。

本文从理论和实践的角度探讨,从数据来源、数据质量、数据检索等几个方面逐步展开,首先为了解决数据来源问题分析了各种爬虫的优劣,编写了定向爬虫程序,定向爬取生活服务类数据,并采用余弦、欧式距离、Shingle三个模块级联的方式对数据进行查重、同时使用朴素贝叶斯方法对数据进行分类并编写数据规范化流程对数据进行深度整理,从数据无重复性和数据分类准确性两个角度为数据质量提供了保证,之后为前端搭建了定位和检索两个WEB服务,设计HTTP接口及传输数据格式,并且为了提高检索速度,使用倒排索引的方式组织数据,实现低时延的数据检索,最后通过系统功能及非功能测试来测试了系统的健壮性和实用性。