当前位置:问答库>论文摘要

题目:基于Web使用挖掘的个性化推荐系统研究与实现

关键词:个性化推荐;Web使用挖掘;数据处理;协同过滤;用户访问兴趣

  摘要

实现个性化推荐服务的手段有很多种,其中基于Web使用挖掘(Web Usage Mining)的方法成为当前该领域的新兴研究热点。Web使用挖掘是通过分析Web日志文件以发现Web网站用户访问行为的重要方法。应用Web使用挖掘技术可以探究出个人用户的访问兴趣以及群体用户的共同访问行为,对实施Web网站个性化推荐服务具有重要的理论意义和应用价值。本文首先对几种常用的个性化推荐技术进行了分析和对比,并对应用最为广泛的协同过滤推荐技术做了重点研究,分析了协同过滤推荐技术使用中遇到的数据稀疏性、冷启动等问题的成因,并指出应用Web使用挖掘技术是缓解上述问题的有效途径。之后本文对Web使用挖掘有关内容进行了综述分析,介绍了Web使用挖掘的相关理论和技术,并从数据获取与预处理、使用挖掘技术以及模式分析等方面对Web使用挖掘技术的研究现状进行了概要性地分析。在Web日志数据预处理技术研究中,本文对预处理中的数据清洗、用户识别、会话识别、路径补充和事务识别五个阶段使用的方法和技术进行了详细分析,并通过应用有关技术和方法开展了预处理实验,为进一步深入研究提供了数据基础。在对用户访问行为及访问兴趣的研究中,本文提出了一种基于语义抽象的用户访问行为建模方法。该方法首先利用网站领域元数据分类体系构造网站语义概念层次树,接着利用语义概念层次树将用户对网站页面的访问行为转化为用户对网站语义概念节点的访问行为,从而降低了用户向量空间的维数,最后,应用本文提出的用户访问兴趣度量方法构建了基于用户访问兴趣的项目评分矩阵。相对于传统“用户-项目”评分矩阵,本文提出的方法所构建的矩阵稀疏性更低。在推荐算法的研究中,本文提出了一种基于用户相似度的改进Slope One协同过滤算法。该算法在原有Slope One算法基础上增加了用户相似度权重,在不过多增加算法复杂度的同时提高了算法的推荐准确率,并通过实验验证了本文提出算法的有效性和实用性。最后,本文应用上述方法设计实现了基于Web使用挖掘的个性化推荐系统,系统可以通过Web日志文件挖掘网站用户的访问行为及访问兴趣,并为网站用户提供个性化推荐服务。