● 摘要
随着越来越多的人开始使用互联网,网络中的数据规模呈爆炸性增长。用户周围充斥着各种各样的信息。因此,用户迫切需要能够借助自动化的系统筛选出感兴趣的内容,过滤掉不相关的内容。这种自动化的系统被称为推荐系统,其核心是推荐算法。研究人员通常是在对用户行为习惯进行分析的基础上,设计高效的推荐算法,尽量准确地向用户推荐他们潜在感兴趣的内容,从而解决信息风暴的问题。在现有的推荐算法中,无论在研究领域还是商用领域,协同过滤算法是目前被广泛使用的一种推荐算法。协同过滤推荐算法包括基于用户的协同过滤推荐算法和基于物体的协同过滤算法两种。但是当前的网络环境已经发生了巨大变化,网络的社会化是一个明显的趋势。经典的协同过滤算法由于没有考虑网络社会化这一因素,已经难以满足现实的需要。因此,需要对经典的协同过滤算法进行适当改进,以适应这一变化。本文针对以上问题,在国内外研究的基础上,结合社会网络的特征,提出了新的活动推荐算法,主要工作包括:1. 本课题选择豆瓣同城活动作为实验平台。通过抓取在线社会网络的大量数据,我们对用户行为进行了详细的分析,包括对用户参与活动的特点、用户对活动的偏好、用户参与活动与用户之间关注行为的分析。通过这些分析我们可以对特定用户建立详细的特征参数。2. 结合社会网络的社会属性,改进了经典的基于用户的协同过滤算法。综合相似用户的概念、用户之间的信任关系和用户本身的兴趣这三个因素,提出了一种混合型推荐算法。实验结果证明,改进后的推荐算法具有更高的精度。3. 设计并实现了一种混合型的社区划分算法,通过准确地将具有相似性的用户划分到一个社区,解决了大规模数据下计算用户相似度耗时长的问题。与其它聚类算法相比,具有更高的精度和同等数量级的速度。4. 实现了所提出的混合型活动推荐算法,并设计和实现了一个完整的原型系统。本文通过实验分析以及实现的原型系统,验证了所提出的结合社会关系、用户偏好、用户相似性的混合型推荐算法的优势及其可行性。
相关内容
相关标签