当前位置:问答库>论文摘要

题目:多视点典型图像目标识别关键技术研究

关键词:多视点,目标识别,稀疏编码,主题模型,概率潜在语义分析

  摘要



目标识别技术是计算机视觉领域中备受关注的前沿技术,被广泛应用于军事、民用等领域。视点变化的问题是目标识别的难点之一。视点的变化还可进一步导致目标在尺度、姿态上发生不同程度的变化,从而增加目标识别的难度。本文针对不同视点下的目标识别问题展开研究,以挖掘图像的高层特征为主要研究思路,对稀疏编码算法、主题模型进行深入研究,主要工作如下所述:

1、研究了稀疏编码算法的基本理论及其相关求解方法。稀疏编码算法是一种无监督学习方法,它通过选择一组“过完备”的基向量来高效地表示样本数据。研究表明,人类视觉系统所感知的图像特征以稀疏编码的形式进行描述。因此,本文以稀疏编码算法作为表示图像高层特征的主要方法。

2、将样本在原始空间中的近邻与非近邻关系描述作为约束方式,提出了基于近邻图与非近邻图约束的稀疏编码算法,使得在原始空间中的近邻样本可以得到相似的稀疏表示,非近邻样本可以得到不相似的稀疏表示。同时,基于样本的距离均值的近邻选择方式比传统的k近邻方式更能反映样本的真实近邻关系。实验表明,该方法所获得稀疏表示的判别能力要优于传统的稀疏编码算法及单纯使用近邻图约束的稀疏编码算法。

3、提出了基于稀疏建模的概率潜在语义分析并将其应用于目标识别。传统的潜在语义分析在图像词袋表示的基础上挖掘图像的潜在语义分布。利用稀疏建模的主题模型以稀疏重构的编码方式代替词袋表示中局部特征描述子与视觉词汇的量化过程,考虑了局部特征描述子与多个视觉词汇的潜在关系,并在此基础上分析图像的潜在语义分布。实验表明,该方法要优于传统的词袋模型及潜在语义分析模型。