当前位置:问答库>论文摘要

题目:基于标签聚类的博客社区发现与推荐研究

关键词:博客;聚类;社区发现;博客推荐

  摘要

作为一种新兴的事物,博客正处于高度发展阶段,近几年来,互联网上的博客数量一直在急剧的增长。随着互联网上博客数量的增加,博客正日益成为网络世界的一类重要信息源。博客社区是具有相同兴趣和共同话题的博客作者集合,如何发现博客社区,如何利用社区资源是现阶段热门的研究课题。博客社区的发现有利于为博客作者提供更好的服务,如博客的好友推荐和博客的文章推荐等等。 本文研究两方面内容:博客社区的发现和博客社区内的推荐机制。 本文利用博客作者的标签数据来提取博客作者的写作兴趣信息,并提出一种模糊聚类的方法,利用这一方法将具有相同兴趣特征的博客作者聚类到同一个博客社区中。实验表明,本文所提出的模糊聚类发现博客社区的方法有效性高于k-means聚类算法,所有这种模糊算法在发现博客社区的应用上是有效的。 在博客社区发现的基础上,本文进一步研究基于博客社区的推荐机制的研究,包括博客好友的推荐和权威博文的推荐。在博客好友推荐中,采用基于作者聚类的推荐爱你算法来改进传统的协同过滤地推荐算法,提高推荐算法的效率;在权威博文的推荐中,综合运用博客链接、评论数据、文章长度、点击率等指标来综合评价博客文章的影响力,并给出推荐。实验表明,本文提出的基于社区发现的好友推荐误差小于传统的协同过滤推荐算法;在权威博文发现部分,通过参照读者评分可以发现,本文提出的基于五项指标来发现权威博客的算法同样也是有效的。