● 摘要
智能移动设备的日益普及带来了移动互联网的迅猛发展,互联网上含有位置信息的资源数量日益增多。如何组织、管理和检索这类资源,成为一大挑战。社会标注服务,汇聚了大众对资源的理解,为我们解决该类挑战提供了重要帮助。本文使用同时包含了位置信息和社会标注信息的图片作为研究载体,围绕着用户、标签、图片、地点四个元素,使用推荐技术等数据挖掘的方法,尝试着将图片推荐给用户,为地点生成形象的图文概览,同时向用户推荐地点,帮助用户快速掌握地点特征,发现潜在兴趣。本文所做的主要工作如下:(1)地点文字和图片概览的生成在图片经纬度坐标集合上,利用聚类的方法自动发现城市的热点区域。在热点区域内,综合考虑标签的使用频率、用户使用率和地域分布规律,提出了衡量热点区域内标签代表度的TagScore函数。建立热点区域内标签之间的有向网络,在此基础上提出TNT话题挖掘算法。基于地域话题和标签代表度,生成地点的文字和图片预览。本文使用采集到的Flickr真实数据对算法进行验证,实验结果证明了TagScore函数的合理和有效性,也表明与主流的LDA话题模型相比,TNT方法效果更好。(2)基于标签的地点推荐提出了基于标签的TBRec地点推荐算法,针对TBRec算法在个性化推荐上力度不足的问题,提出了可以衡量用户标签权重的ATBRec算法。针对推荐系统中比较常见的数据稀疏问题,提出了使用标签有向网络对标签进行扩展的数据预处理策略。最后进行了实验对比,使用Item-based CF作为对比的基准,实验结果表明,经过标签扩展的ATBRec-E算法效果最好。在以上两部分的研究基础上,本文设计并实现了一个旅游自助原型系统——WhereToGo,该系统自动生成热点区域的文字和图片概览,还为用户个性化地推荐地点。
相关内容
相关标签