● 摘要
一直以来,新闻阅读都是人们日常生活的强需求之一,传统的新闻媒体是大众获取信息的主要来源。伴随着互联网的蓬勃发展,人们又多了一条获取信息的渠道。然而互联网上每天有数以万计的新闻发布,如何从中快速准确的找到用户感兴趣的内容成为了一个亟待解决的问题。在其他领域发挥了重要作用的个性化推荐技术在这个时候走进了新闻阅读领域研究者的视野中,其应用亦受到越来越多的关注。设计推荐系统的一个关键问题是如何描述用户的兴趣。微博等社交平台的出现为我们描述用户兴趣提供了一个新的思路,通过对用户微博数据进行挖掘来建立用户的兴趣模型成为了最近几年的研究热点。
本文提出了一种基于微博用户兴趣建模的方法,将用户阅读新闻兴趣划分为长期的主题兴趣以及近期的关键词兴趣展开分析,并在此基础上给出新闻推荐策略以及整个新闻推荐系统的设计与实现方法。我们从用户微博中过滤出新闻相关内容,在新闻数据集上训练主题模型、词向量模型用来推理用户的兴趣主题分布,学习用户关注点的词向量特征。用户的长期兴趣用新闻相关微博的主题分布来表征,近期兴趣则用微博中关键词带时间权值的词向量来表征,随后建立起用户的兴趣模型,计算用户与待推荐新闻之间的相似度。在新闻推荐列表生成阶段,我们依据用户的兴趣主题分布,从各主题下抽取相应比例的新闻,以满足用户阅读新闻时的多样性需求。基于上述方案,我们给出了整个推荐系统的设计与实现,并通过与其他推荐方法的对比验证了我们所提出的模型在发现用户兴趣,提升推荐效果上更加有效。
相关内容
相关标签