当前位置:问答库>论文摘要

题目:结合社会标签语义的协同过滤推荐方法研究

关键词:个性化推荐系统;协同过滤;K近邻;社会标签相似度

  摘要

随着互联网规模和在线数据规模的不断增长,个性化推荐技术开始成为帮助用户从海量数据中快速,智能地获取相应信息的有效方法。个性化推荐系统根据用户个人不同的兴趣爱好进行推荐,其中最常用的一种个性化推荐系统的实现技术就是协同过滤推荐技术。同时社会标签网络让互联网用户可以通过自己选择的标签来分享、标注、搜索网络资源,其包含的很多语义信息和重要的用户喜好信息也可以用来作为协同过滤推荐的数据来源。本文首先对基于评分相似度的K近邻模型进行了分析和研究,以面向项目的K近邻模型为重点研究对象。该模型的特点是主要根据评分相似度来计算出项目的K个最近邻居,存在的问题主要是进行推荐时,K值过大会导致计算量过大而影响推荐产生的实时性;而K值过小会导致推荐精度下降。现有的对基于评分相似度的K近邻模型的优化方法,主要是使用社会标签集合的笛卡尔相似度或使用项目间的相似度支持度进行优化。而论文发现可以使用社会标签的语义相似度与评分相似度支持度结合来继续对模型进行优化。论文结合现有技术研究了社会标签语义相似度的计算方法,通过对现有Web2.0中的社会标签网络进行分析,分别进行标签之间和标签集合之间的相似度计算,并将社会标签相似度融合到推荐系统中。论文提出了结合社会标签相似度的K近邻模型,主要工作是以项目社会标签相似度支持度的方式将社会标签网络的语义信息集成到K近邻模型中去,来改善模型的性能。本文提出了三种融合社会标签语义相似度(Folksonomy Similarity,FS)和评分相似度(Rating Similarity,RS)的方法,包括以百分比融合、以权重融合和结合评分相似度支持度以概率分布加权融合。最后,本文在真实的数据集上完成了实验和分析。通过本文的研究表明,结合社会标签语义的协同过滤推荐方法使用社会标签语义相似度优化后的K近邻模型,发掘了社会标签之间、社会标签和项目之间的相关关系,更好地衡量了项目与项目之间的近邻关系,构建的K近邻模型更加准确,使推荐系统的性能在推荐精度上进一步提高,达到相同性能时的K值的选取有了一倍以上的优化。