当前位置:问答库>论文摘要

题目:主动引导型Web搜索引擎的研究与实现

关键词:搜索引擎;个性化;兴趣剖象;元搜索;日志挖掘;协同过滤

  摘要

据弗吉尼亚理工大学GVU中心的调查报告,全世界有84.8%的WWW用户通过搜索引擎获得自己所需网页,由此可见搜索引擎已成为互联网上最重要的应用之一。搜索引擎的开发涉及到信息检索、数据库、数据挖掘、人工智能、分布式处理、自然语言处理等多个领域的理论和技术,因而具有综合性和挑战性。 搜索引擎能在一定程度上满足人们对信息查找的要求,但由于其通用的性质,在面对各种不同背景用户提交的目的相异的检索请求时,往往不能返回与用户兴趣相关度高的检索结果。本文针对目前搜索引擎存在的不足,研究了搜索引擎技术、个性化技术与Web挖掘技术,并结合这三种技术提出了主动引导型搜索引擎模型,使搜索引擎能引导用户更好的完成信息获取过程。兴趣树为整个主动引导型搜索引擎模型的基础,所有个性化相关度的计算都要基于兴趣树完成,文中介绍了一种兴趣树生成方法,并在此基础上给出了基于用户日志与兴趣树计算用户兴趣剖象的方法。主动引导型搜索引擎模型是构建在协同推荐技术基础之上的,而协同推荐技术又要基于用户组对推荐信息进行计算,文中给出了用户组的生成算法与本地推荐网页的生成算法,并且详细介绍了一种基于用户组与用户上传的推荐信息进行协同推荐的方法和一种基于Markov模型进行查询关键词推荐的方法。 基于以上理论研究成果设计并实现了主动引导型搜索引擎IGSearch系统。系统在客户端通过IG Client软件收集和分析用户的日志与兴趣剖象,在服务器端对用户浏览日志与查询日志进行分析和挖掘,最后基于元搜索引擎技术为用户提供基于个性化剖象的检索服务和基于用户兴趣组的信息推荐服务。用户的检索日志与仿真测试的检索结果都表明IGSearch系统能提供与用户兴趣更相关的检索结果,并且推荐功能也可以引导用户更快完成其信息检索过程。