● 摘要
场景分类技术在图像检索、视频分析、遥感图像分类、网络内容过滤等领域有着广泛应用,但一直以来场景分类技术研究中面临着语义鸿沟问题和场景视觉对象差异性等问题。近年来,计算机视觉领域的研究学者提出了中层图像块的思想,通过提取图像中具有该类别显著特性的局部图像区域,获得该类图像的主要特征信息,从而进行后续的图像分类、分割与理解等应用工作。
中层图像块的显著性主要是代表性和区别性两方面,能够很好的克服图像底层特征不能准确反映图像语义信息的缺陷,以及场景图像的高层目标需要明确语义概念的限制,在场景分类技术应用中有着很大优势。本文主要研究中层图像块提取算法以及中层图像块在场景图像分类中的应用。
首先,完成中层图像块搜索算法设计。本文通过分析中层图像块的主要性质,引入HOG特征与GIST特征进行结构信息提取,设计中层图像块的显著性新型量化评测标准,设计中层图像块显著聚类中心交叉迭代更新算法,最终实现场景图像显著性结构区域的提取。
其次,完成基于中层图像块的场景分类算法设计。中层图像块可以视为该类场景的主要视觉信息目标。本文中利用中层图像块对词袋模型算法进行改进:利用所提取的每类场景的中层图像块来构建视觉中心,形成视觉词典;然后计算图像局部特征在该词典中的向量量化分布;引入空间金字塔模型并设计特征汇总方式,形成图像中层向量;最后利用SVM分类器完成场景图像分类工作。
最后,通过Scene15数据集、Caltech101数据集、MITIndoor67数据集、北航校内场景图像数据集,四类不同类型的数据集对设计算法进行实验验证,提取每类样本图像的中层显著图像块,并与经典的BoW模型算法进行实验对比,验证所设计算法的有效性。
相关内容
相关标签