● 摘要
门户作为新一代网络应用的开放式平台,具有良好的发展和应用前景。随着门户技术的迅速发展以及面向服务架构的推动,基于门户平台的资源整合及个性化服务手段已愈发丰富,用户的个性化兴趣也更加复杂多样且动态变化。这为门户平台上的兴趣挖掘和推荐服务研究带来了新的挑战,同时关于提升门户个性化服务质量的技术或方法的研究,也得到越来越多研究者的关注。如何隐式地获取和准确描述用户个性化兴趣、如何发现不同用户的兴趣迁移模式、如何构建用户个性化兴趣模型以及提供面向门户的个性化推荐服务是其中的重要课题。 本论文针对上述课题挑战,对门户个性化兴趣挖掘和推荐服务等关键技术进行了深入探索和研究,主要工作内容如下:1. 针对门户兴趣隐式挖掘特点的分析,提出了一种门户个性化兴趣隐式挖掘方法。论文在对门户个性化兴趣行为映射和语义描述的基础上,提出一种独立于门户平台的含隐私保护的门户个性化兴趣隐式获取机制。可实现对不同门户平台的用户访问行为的隐式获取,并采用兴趣扩展规则描述方式实现私有化过滤和重要兴趣行为语义检测的过程。由于针对门户架构特点对兴趣隐式挖掘方法各环节进行了必要完善或精简,实验表明该方法在跨平台适用性、隐私保护安全性、兴趣关联描述准确性以及高效性等方面均具有良好的性能。2. 基于隐马尔可夫模型理论及其在兴趣迁移模式中的应用分析,提出了一种门户个性化兴趣迁移模式发现方法。旨在进一步理解不同用户在门户中的个性化兴趣行为模式和迁移目的,改进布局结构设计并用于门户推荐服务选择参考。论文定义了一种基于HMM扩展描述的门户个性化兴趣迁移模型INMP2(Interest Navigation Model in Personalization for Portal)及关联规则INAR(Interest Navigation Associative Rule),从而利用HMM的关键推理方法发现最可能的个性化兴趣迁移模式。论文对该方法的有效性和预测能力都进行了实验评价。3. 遵循有限混合模型理论,融入门户个性化兴趣语义及潜在兴趣语义关联描述,提出了一种基于潜在兴趣语义描述的门户个性化兴趣模型PIM-LISD(Personalization Interest Model based on Latent Interest Semantic Description)。通过合理选取不同先验概率分布来适配潜在兴趣语义的后验概率分布,并在模型学习过程中采用了优化的期望值最大化算法TEM迭代估算模型的潜在兴趣语义参数。论文利用对潜在兴趣的最大似然估计结果,实现了无监督的用户群模糊聚类算法,并给出了PIM-LISD兴趣模型的存储和更新方法。实验不仅验证了建模方法的全局收敛性、精确性和适配合理性,而且客观评价了该聚类算法良好的稳定性、鲁棒性和高效性。4. 鉴于目前组合推荐方法和面向门户的服务体系架构设计上的不足,论文提出了一种面向门户且支持组合推荐的新颖完善的个性化推荐服务架构。引入了元推荐引擎,能够将数据资源和推荐算法统一控制管理,通过配置元推荐策略推动执行相关组合推荐计算,并将产生的Web应用推荐结果直接封装为直观的门户组件展现。由于现有的Memory-based CF或Model-based CF推荐算法单独执行时并不能较好地兼顾精确性、实时性和扩展性,论文也提出将二者有机组合起来,基于PIM-LISD和INMP2等模型构成一种新的适用于该架构的组合推荐算法MultiModel-based CF,实验表明其具有较好的综合推荐性能。