当前位置:问答库>论文摘要

题目:基于数据挖掘的书签推荐系统的设计与实现

关键词:社会性书签,推荐系统,;分布式系统,;ruby;on;rails,数据挖掘

  摘要

本文源于创业项目diigo.com, 采用了Ruby on rails 应用程序框架来实现书签管理;并在Mysql 数据库的基础上,自写了database gateway, 达到分布式数据库的功能,实现了数据库的可扩展性;在理解搜索引擎原理的基础上,实现了实时的标签搜索(tag search), 并以开源搜索引擎lucene 为模板,实现了具有特定权重的全文搜索。 在此基础之上,通过计算Tag 和Tag 的相似度,挖掘相似tag, 用于搜索引擎中的相关搜索;并进而通过tag 的相似性,计算系统中用户和用户的关联性,使用TF-IDF算法,获取网页和tag之间的关联性,实现向用户推荐用户,向用户推荐tag的功能。 本文所完成的系统,融合在diigo.com 网站里面,该网站获得了多个奖项,包括美国参议员JOHN ENSIGN 颁发的技术创新成就奖,CNET 所评选的2009 Webware 100 等。