● 摘要
浏览器个性化阅读推荐是基于用户的浏览行为从浏览关键词的角度进行内容的抽取、筛选与分类,挖掘用户的个性化特征和兴趣偏好,从而进行个性化新闻、资讯、博客等内容的推荐。本文主要介绍了个性化阅读推荐的原理,分析导致个性化阅读推荐准确率低的原因,并针对性地提出提高推荐准确率的方法。
目前浏览器个性化阅读推荐准确率低的主要原因是用户浏览内容中的资讯类内容被大量的娱乐类、生活类内容所淹没,同时用户在浏览资讯内容的过程中许多非用户兴趣偏好的无效阅读内容也会被记录且被运用到个性化计算中,而这些内容都会极大的降低用户个性化阅读推荐的准确率。由此,本文提出了在现有个性化阅读推荐系统的基础上,加入基于用户浏览场景维度和用户阅读时间维度的新推荐方法。本文对用户浏览内容进行场景的分类,并赋予不同场景的下的网页以不同的权重系数,研究并优化了不用权重系数对分类准确率的影响,以此来降低用户浏览的娱乐类、生活类内容对判断用户对资讯内容的兴趣偏好的干扰。在场景判断的基础上本文还研究了用户阅读时间对用户兴趣特征的影响,通过将用户阅读时间和正常阅读时间进行对比,用户阅读时间越短的内容说明用户兴趣度越低,因此从阅读时间这个维度来规避用户无效阅读内容在个性化计算中的干扰,以提高系统对用户所浏览的资讯内容的分类识别的准确率。
最终本文采用A/B测试的方法,验证了加入基于用户浏览场景维度和基于用户阅读时间维度后的新的推荐方法相比较与原推荐方法相比,在个性化阅读推荐准确率上有显著提升。