当前位置:问答库>论文摘要

题目:个性化职位推荐系统的设计与实现

关键词:个性化职位推荐;混合用户模型分析;基于内容的推荐;多维向量;余弦相似度

  摘要


在信息技术革命的大潮中,海量信息每时每刻都在产生。面对如此巨大的信息,人们如何进行选择和决策变得越来越困难了。对人们的兴趣偏好进行分析,在海量选择范围内为用户推荐正确的事物,是目前解决信息过载问题最有效的途径。招贤令是一个专注于互联网行业的招聘求职网站,课题系统通过分析网站上求职用户的能力和兴趣偏好,在海量的职位信息中为其推荐最佳工作。为此,分析用户的能力偏好和推荐个性化职位是系统需要解决的两个关键问题。

分析用户的能力偏好是通过构建用户模型实现的,俗称“用户画像”。用户模型包括用户基本信息和用户行为信息两种数据来源。用户基本信息能够显式地表明用户的能力兴趣,包括社交媒体信息和用户简历信息;用户行为信息能够隐式反映用户的能力偏好,系统涉及了三种用户行为,包括求职者申请招聘的职位、求职者通过社交媒体分享自己感兴趣的职位、求职者评论职位。不同的用户行为反映的兴趣级别不同,对用户模型的影响也不同,系统通过为各行为设置不同的权重参数来实现区分。另外,用户的兴趣会随着时间改变,为了让数据体现出时效性,系统在用户模型构建过程中添加了数据渐忘因素,实现用户行为反馈的兴趣偏好随时间衰退。所有这些信息构成了一个混合用户模型,模型使用多维向量表示,通过Rocchio算法将各种数据进行线性合并。

在混合用户模型分析的基础上,个性化职位推荐通过基于内容的推荐方法实现的。通过比较混合用户模型和网站上的职位来找到最合适的职位,其中,混合用户模型和职位二者都是通过多维向量表示,采用余弦相似度算法对向量进行比较。在混合用户模型向量和招聘职位向量构建过程中,系统还引入了分类体系。分类体系通过归类匹配和近邻匹配两种方式帮助系统实现模糊匹配,为求职者推荐更多跟自己相关的职位。

实现过程中,web服务使用SpringMVC,搜索框架使用Apache Solr,Solr负责向量存储和推荐逻辑。数据采用混合持久化,使用MySQL、Redis和Solr存储数据。

评测过程中,比较了混合推荐、简历推荐和相关反馈推荐三种方式。评测结果发现,基于混合用户模型的推荐效果明显优于只有用户简历数据的推荐。