当前位置:问答库>论文摘要

题目:面向图像检索的哈希位选择方法的研究与实现

关键词:哈希位选择,近似最近邻检索,位置敏感哈希,马尔科夫过程,AAS聚类

  摘要



近年来图像数据爆炸性的增长,对数据存储、检索和索引技术提出了越来越高的要求。尤其在维度动辄成百上千的图像检索中,索引技术的发展显得尤为迫切。目前在处理这种高维数据的索引技术中,比较有效的是基于哈希映射的索引技术。但该技术的发展也面临着很多新的技术问题,尤其在面对不同数据集、图像特征、不同哈希算法及应用场景时,随着人们对检索效率提出更高的要求,图像检索领域亟需一种稳定且高效的哈希索引方法。

本文的研究目标即通过机器学习和随机过程中的技术,实现哈希位选择方法,从而得到可以应用于大规模图像检索中高维特征数据索引得哈希表。目前对哈希位选择问题的研究,基本都是将哈希位池中选择哈希函数集合的过程,转化为在一个无向权重图上寻找子图的问题。在此基础上,本文利用马尔科夫过程以及AAS聚类方法,提出了三种高效实现哈希位选择的方法。

针对构建单哈希表,本文提出了两种基于马尔科夫过程的哈希位选择方法。通过互信息和相似性保留能力,定义系统状态在权重图上的转移概率;然后在权重图上模拟马尔科夫过程;最后当状态访问分布达到稳态时,对所有状态的分布值排序,选出得分最高的哈希位组成哈希表。实验结果表明这种基于马尔科夫过程实现的哈希位选择构造出的哈希表有优秀的检索效果。

研究证明多哈希表查询是提升图像检索查全率的一种方法。因此本文也提出了一种基于AAS聚类方法和马尔科夫过程的方法实现哈希位选择,用于构建多个互补且自身索引性能优良的哈希表。首先对哈希位池进行多次AAS聚类,在每个类别中提取一张哈希表,用于构建一个哈希表池;然后根据连续型马尔科夫过程从哈希表池中挑选具有优秀检索性能且互补的哈希表组合。实验结果表明这种哈希方法在稳定性、耗费时间和查全率上都有很好的表现。

最后设计实现了基于哈希位选择的(多)哈希表生成器与基于哈希位选择的图像检索系统,验证了本文提出的三种算法的有效性与实用性。