● 摘要
在21世纪的信息化时代,网络为我们的学习提供了方便。基于信息化环境,我们的学习方式更趋向于多媒体学习、网络学习和移动学习,而这些方式都离不开互联网提供的庞大信息资源库。但由于网络上的信息资源覆盖范围广、分布散乱、容量大,加之,每个人都可以在互联网上索取、存放信息,而网络对这些信息没有质量控制和管理机制,导致各种无用的信息大量充斥在网上,用户在查找信息时,检索出的资源繁多,而且呈现形式多样化,所以,在信息化爆炸时代,用户想要找出满足自己需求的资源具有一定的挑战性。因此,如何构建满足用户个性化查找需求的资源库构建技术及基于用户个性化需求的资源推荐、查询算法成为研究的热点。
一般资源库通过手工构建或自动构建。手工构建能够根据领域关键字将资源信息存于资源库中,构建出完备的资源库,但随着领域规模的扩大,罗列的关键字会越来越多,相对应的资源也更加丰富,此时手动构建模型费时费力,已不能满足要求。针对费时费力问题,自动构建的研究具有重要意义,自动构建模型是基于网页抓取算法实现的,资源库中的学习资源之间相互独立没有任何联系,在进行个性化资源推送、查询时会忽略了语义问题,即有可能忽略用户的真正需求和查询的真正意图,这将会造成资源推荐、查询的不准确。本文在使用PageRank算法抓取网页资源的同时,结合领域本体分析抓取资源的语义相关性,自动构建学习资源库,并将其应用于个性化资源推荐中。
本文研究的主要内容如下:
(1) 基于本体的学习资源库的自动构建及存储。针对现有资源库构建模型的不足,提出了一种基于领域本体和网页抓取算法的学习资源库构建模型,该模型使用PageRank抓取算法对网页资源进行抓取,在抓取资源时结合领域本体对抓取资源的语义相关性进行分析,从而构建特定领域资源库,同时分析对比已有本体存储方法,根据一定的存储规则使用MySQL关系数据库对其存储。
(2) 用户兴趣模型研究。由于信息呈现的不同方式对用户兴趣度影响不同,因此根据资源类型对一般用户兴趣模型进行改进,主要从兴趣内容及资源类型两方面进行。对用户个性化需求部分中的资源类型及兴趣度权重估计进行分析、改进,并利用遗忘因子实现对用户兴趣概念的更新。
(3)个性化资源推荐。结合本体和蚁群算法,提出了基于本体和蚁群算法的个性化资源推荐算法。首先,利用蚁群算法对用户进行聚类,得到相似度大的几个用户;其次,根据得到的相似用户提取出其兴趣概念,组成概念集,从领域资源库中进行资源推荐,完成个性化的资源推荐,并对通过实验系统进行验证。
相关内容
相关标签