● 摘要
随着互联网与电子商务的迅速发展,人们越来越依赖互联网服务并习惯通过Web 2.0社区分享观点与见闻。在线旅游是经济效益最好的互联网应用之一,网络上有丰富的旅游领域信息以及用户生成内容,用户对在线旅游服务的需求日益增长。旅游资源提供商和旅行社逐渐将其服务信息化以方便用户检索。传统的信息检索为每个人返回相同的结果,而搜索技术的发展趋势是提供个性化的搜索结果排序。云游天下项目旨在设计第三代在线旅游应用,以满足用户对一站式服务和个性化定制旅行计划的需求,特色是在实体层面上整合不同来源的旅游领域信息,提供个性化的实体推荐、游记推荐和行程推荐。该项目包括垂直搜索引擎、智能优化组合、动态行程演化等三大子系统。本文工作内容为垂直搜索引擎子系统,通过构建垂直搜索引擎来整合旅游领域的多源信息,并提供个性化的游记推荐功能,使用户在检索景点相关游记时可以用游记对系统用户的帮助程度排序。本文研究了旅游领域垂直搜索的相关问题,包括:研究识别互联网上的旅游相关的中文网站和网页的方法;研究多源实体整合方法,识别相似重复实体;研究个性化的游记推荐方法,分析游记与用户和实体的关系,采用信任感知与传递的方法挖掘用户社交网络隐含的信任关系,运用用户间的信任关系指标结合游记质量来预测游记的可用度,作为整合后的检索排序指标,提高了分类预测的准确率。在上述研究的基础上,设计实现一个面向旅游领域的垂直搜索引擎,实现发现网上旅游领的信息并整合到领域实体的功能,可以检索结构化数据并向用户推荐有帮助的游记。