当前位置:问答库>论文摘要

题目:面向图像理解的特征信息优化表达及场景目标识别与分析

关键词:图像理解;;信息提取;优化表达;;目标识别;;场景分析

  摘要

图像理解根植于计算机视觉,是图像研究领域的高层内容,其根本任务是实现中低层的数据处理分析与高层知识表达和推理的有效结合,以理解并解释所感知的场景图像和场景中的内容。显然,图像理解过程具有鲜明的层次性,其低层所涉及的是视觉信息,以计算机视觉为理论基础,而高层则以知识信息为主,理论出发点是人工智能。图像理解与计算机视觉、模式识别、人工智能等学科有着天然的密切联系,现已成为网络化智能信息时代的前沿热门研究领域,具有广阔的应用前景。图像理解包括从下至上的数据驱动和自上而下的知识导引,其主要内容包括场景中的目标识别及场景的描述与理解。从计算机处理过程来看,将视觉系统所获取的图像首先进行特征信息提取与合理表达,然后通过一系列计算分析和认知学习过程,输出有关场景中目标识别、目标之间的关系和/或图像的整体描述、以及推断理解的结果,从而实现和人类视觉系统相接近的理解外部世界的目的。本文以图像理解中的特征信息提取与优化表达、场景目标识别与分析等为研究内容,主要贡献和创新点如下:(1)提出了一种基于局部不变特征和局部上下文关联信息的场景目标识别算法。以图像局部特征分析为出发点,针对局部不变特征在场景目标识别中的缺点,将基于学习框架的特征选择方法与目标的局部上下文关联信息相结合,增强了局部不变特征对于图像内容的语义信息描述能力,解决了现有的局部不变特征集中信息冗余所导致的特征信息描述力欠佳的问题,从而使基于局部不变特征和上下文信息的概率分类模型更为简单有效,在小样本条件下可取得良好的识别结果,也适用于较大规模数据集的目标识别问题。(2)建立了基于先验知识的场景分类优化决策模型,给出了有效求解方法。针对概率潜在语义模型在场景语义分析中无法引入场景数据的先验知识和该模型参数在求解过程中的不稳定及过拟合现象,利用模型参数矩阵在高维数据条件下的稀疏特性,将同类场景数据的低秩性及单幅图像相对于语义主题的稀疏性作为约束条件,构建了概率潜在语义分析优化决策模型,采用非精确拉格朗日乘子法给出了有效求解。实验结果表明基于先验知识信息的场景分类优化决策模型可获得低维空间中紧致有效的场景语义表示,具有更好的场景语义分类性能。(3)提出了一种基于有损信源编码和稀疏矩阵变换的杂散光降质图像快速恢复与校正算法。针对光学成像系统在场景图像成像过程中所形成的杂散光降质图像,在杂散光空变点扩散函数建模的基础上,对图像进行有损信源编码,在保持图像细节信息的前提下对图像数据进行压缩处理,进而采用稀疏矩阵变换代替确切的矩阵变换来实现图像信息的稀疏表示,最终采用非迭代的Van Cittert方法进行图像恢复,并实现杂散光降质图像的快速校正。通过场景图像的压缩编码和稀疏变换,可大大减少算法复杂度,并能有效保持图像的细节信息,有利于后续的场景目标识别与分析。(4)提出了一种将局部语义和空间上下文信息相融合的场景语义分析方法。在深入分析场景图像空间配置结构特性的基础上,利用高斯混合模型实现了图像中低层视觉特征信息到中层语义信息的统计映射,并在此基础上,通过互信息策略针对不同区域语义目标对象间的上下文依赖关系进行学习,进而在贝叶斯网络识别框架下利用不同类型的场景特征信息进行学习和推理,可取得良好的场景分析结果。(5)为了检验本文研究给出的理论算法的实用性与应用效果,针对空间场景目标识别与理解分析的实际背景和技术需求,在深入分析空间目标图像特性的基础上,通过角点特征获得局部感兴趣区域,并将区域的灰度梯度信息,不变矩特征以及邻域内统计特征信息进行组合与优化表达,然后建立了针对空间目标识别与理解分析的优化决策模型,通过仿真实验验证了其在空间目标的分类识别与理解分析方面的可行性与有效性,可为进一步的实际应用提供参考依据。本文从自下而上的数据驱动和自上而下的知识导引等多个途径深入研究了面向图像理解的特征信息提取、优化表达方法、以及场景目标识别与分析算法,并结合自然场景图像和空间场景目标的识别与分析等实际应用背景,通过仿真实验,检验和验证了文中所提算法的性能优势,为进一步推广应用奠定了基础。本文的研究成果对丰富和发展图像理解与分析、特征信息提取与优化表达,场景目标识别与分析等研究领域的理论体系,研发新型实现技术具有重要意义。