● 摘要
预测模型标记语言(Predictive Model Markup Language,PMML)是一种标准的数据挖掘建模语言,它的出现使各数据挖掘系统之间可以共享模型,既可以解决目前各数据挖掘系统之间封闭性的问题,又可以在其它应用系统中间嵌入数据挖掘模型,解决孤立的知识发现问题。其被W3C(The World Wide Web Consortium)承认为数据挖掘建模方面的标准,并获得了各大数据库生产商的支持,具有广阔的应用前景。个性化推荐技术是以数据挖掘技术为基础,综合了统计、心理学等技术而发展起来的,是数据挖掘技术的新应用。个性化推荐技术旨在解决当前“信息过载”的问题,对用户提供“信息找人,按需服务”的功能。当前应用最成功的个性化推荐服务是协同过滤技术,个性化推荐服务的发展方向是通过组合推荐来弥补各种推荐技术的弱点而向用户提供更好更精确的推荐。PMML在数据挖掘领域取得了很大的成功,而个性化推荐服务是以数据挖掘技术为基础的服务,并且PMML具有很强的扩展功能以及将不同的挖掘模型进行组合的功能,因此本论文提出将PMML进行扩展使其可以描述主流的协同过滤推荐模型,并以这些模型为基础进行组合推荐服务,实现了基于PMML数据模型的组合推荐服务。本文主要的工作和取得的成果包括:1) 对基于协同过滤的个性化推荐技术进行了研究,包括基于模型的协同过滤技术、基于内存的协同过滤技术和进行组合推荐的策略等,并对它们各自的特点和不足进行了总结和比较。2) 深入研究了PMML规范,并且根据PMML的扩展机制对基于概率的协同过滤技术、基于用户的协同过滤技术、基于项目的协同过滤技术、基于贝叶斯网络的协同过滤技术、基于SVD的协同过滤技术和组合推荐的评价进行了扩展,使PMML规范支持以上的推荐模型。3) 利用PMML的组合推荐功能,对组合推荐的策略进行了研究和细化,对于组合推荐的模型进行了控制,对组合推荐的输出进行了规定,并且提出了使用PMML定制组合推荐服务的策略。4) 在前述分析基础上,具体设计并实现了基于PMML数据模型的组合推荐服务机制。实现了通过更改PMML组合方式来更改组合推荐的推荐策略。实现了可以根据数据集的不同,推荐要求的不同,推荐环境的不同而迅速的更改推荐策略的目的。5) 在基于PMML数据模型的组合推荐服务的当前实现基础上,对基于PMML数据模型的组合推荐服务进行了具体实验验证和结果分析。本论文提出的基于PMML数据模型的组合推荐服务较为完整的描述了组合推荐服务的具体实现方式,并且具有广泛的适用性和良好的可扩展性,可以较好的满足通过修改PMML模型的组合策略来修改个性化系统的组合策略,具有较好的应用前景。
相关内容
相关标签