● 摘要
电子商务推荐系统是电子商务网站用来向顾客提供商品信息和建议,并模拟商店销售人员帮助顾客方便地完成购买过程的自动化系统。协同过滤推荐算法是当前推荐系统最成功的算法。传统的协同过滤推荐算法由于评分数据稀疏性的影响,降低了推荐结果的准确性。基于项目聚类的协同过滤推荐算法通过对项目进行聚类并生成对应的聚类中心,在这些聚类中搜索项目的最近邻居,从而在尽量少的项目空间内搜索到目标项目的大部分最近邻居,有效地提高推荐系统的实时相应速度。但是,应用传统的项目聚类算法,在推荐精度上存在缺陷。 本文针对推荐系统数据集高维稀疏的特征,以及当前协同过滤推荐算法所面临的主要难点,在现有高维稀疏数据聚类研究的基础上,利用评分数据稀疏差异度和项目类别构造集合差异度度量公式,用以在用户—项目评分矩阵上进行项目聚类,并在此基础上进行项目相似性计算和最近邻居查询,对用户未评分的项目进行评分预测,进而产生推荐。实验证明本文提出的基于稀疏差异度和项目类别的项目聚类算法及在此基础上的协同过滤推荐结果优于传统的K-means聚类算法。同全项目集协同过滤推荐相比较,在效率和推荐精度上也表现出一定的优越性。对照实验和参数敏感性分析显示了项目类别因子、项目评分因子、集合差异度阈值、最近邻居查询个数等参数以及项目聚类顺序对推荐结果的影响。