当前位置:问答库>论文摘要

题目:基于WordNet和FCA的网页推荐模型研究

关键词:网页推荐;WordNet;FCA;语义距离;搜索引擎

  摘要

现在的搜索引擎技术已经有了很大发展,但是当我们上网查询信息的时候还是经常会感觉到搜索引擎所返回的结果并不是尽如人意,单一的结果显示模式难以使用户挖掘出网页中更多的潜在信息,同时基于词形的用户查询词和网页关键词匹配模型无法发现词语之间的语义关系,难以更好地实现用户需求和网页信息之间的匹配。 本文提出了基于WorldNet和FCA(Formal Concept Analysis)的网页推荐模型,模型结合WorldNet和FCA技术,借助协同过滤的基本思想,采用网页推荐的方法对当前的搜索引擎进行了改进。本文在Google、百度、Lucene等第三方搜索引擎下,利用FCA技术对网页信息进行过滤,形成网页URLs-关键词形式背景,构造FCA知识库。随着FCA知识库的不断完善,模型就能为用户提供子概念和父概念的推荐服务。通过FCA知识库的概念推荐,用户可以获得自己可能感兴趣的潜在知识信息,实现网络用户之间知识的共享。在概念匹配策略中,本文引入了WordNet,对用户查询词和网页关键词进行语义计算,更好地实现用户需求与网页信息的匹配,克服了传统的基于词形匹配所带来的返回信息过多或是漏检有用信息等问题。模型还对查询扩展机制进行了研究,使用户通过推荐的扩展词来不断完善查询向量。本文最后采用Java语言作为实验编程语言,在eclipse3.2和JDK1.6环境下实现了推荐系统的基本功能,并对检索效果进行了实验验证。实验结果表明,相对于Lucene全文检索策略,本文提出的推荐模型在查准率方面有了明显的改善效果,查全率随着概念格中概念的增加也逐渐得以改进。