● 摘要
互联网技术的迅猛发展把我们带进了信息爆炸的时代。海量信息的呈现,一方面使用户很难从中发现自己感兴趣的部分;另一方面也使得大量少人问津的信息(网络中的“暗信息”)无法被一般用户获取。个性化推荐是通过建立用户与信息产品之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐,其本质是信息过滤。传统的个性化推荐算法面临一些问题,如:许多无评价资源、数据稀疏性、可扩展性、冷启动等问题。针对这些问题,本文设计并实现了基于本体的个性化推荐算法,完成的工作包括:针对科技资源元数据的分类特点,通过对OWL语言的分析,设计并实现了基于元数据分类体系的领域本体半自动化构建方法。该方法的实现使得本体构建从纯人工的方式转变为半自动化的方式,减少了工作量,提高了效率。通过挖掘Web日志中的用户行为信息,使用Jena工具把用户行为映射到用向量空间模型表示的本体概念层次树上,从而构建用户模型。该方法能使无评价资源转化为有评价的概念结点,改善了无评价资源的个性化推荐问题;另外,本体概念层次树的使用降低了用户向量空间的维数,提高了个性化推荐效率。实验证明,基于本体的用户模型比基于分类的用户模型在推荐准确性上有较大的提高。通过分析传统相似度算法的不足,本文提出了一种改进的相似度算法,该算法综合考虑了两个用户共同评价的概念结点数目与未共同评价结点数目的比值、用户在共同评价过的概念结点上评分的接近程度和用户向量之间的夹角三个因素,改善了稀疏矩阵相似度计算的问题。实验证明,该算法在一定程度上提高了推荐质量和覆盖率。在推荐阶段,针对新用户无行为记录,本文引入了Jena推理方法初始化用户模型,获得用户可能感兴趣的概念结点集,一定程度上改善了新用户的冷启动问题。最后,本文利用以上方法和技术,设计并实现了一个基于Jena的个性化推荐系统。该系统的特点一是解决了无评价资源的推荐问题;二是提高了稀疏矩阵相似度计算的准确性;三是改善了个性化推荐系统的冷启动问题。
相关内容
相关标签