● 摘要
仿生人类认知机理,研究高度智能化的信息处理方法已成为计算机视觉领域一个重要的研究方向。近年来,随着信息科学与认知科学交叉研究的深入发展,这种趋势已表现得越来越明显。通过学习认知科学对人类和其他生物的某些重要生理机制的研究成果,构建相应的可计算模型,用于解决计算机视觉领域的相关问题。其中,视觉选择性注意的模型化计算与应用便是其中一项重要且具有挑战性的研究内容。在人类视觉系统中,视觉选择性注意是重要的感知机制之一,它通过调节有限的大脑处理单元与海量环境信息之间的资源分配,引导高效可靠的视觉感知。因此,通过对视觉选择性注意机制的模型化计算,可为解决计算机视觉中的环境感知、快速目标检测等问题开辟新的途径,并有可能取得令人惊喜的结果。本文以此为出发点,深入研究了视觉选择性注意的模型化计算方法及其在快速目标检测中的应用等相关问题。主要内容和创新性贡献如下:(1)从人眼的感知效果出发,根据不同特征图的分布特性,提出了一种新的特征整合自适应权重估计算法,以解决现有的基于感知信息驱动的视觉注意模型在特征整合阶段未能体现各个特征重要性区别的缺憾。通过有偏置的特征加权整合,使得感兴趣区域检测结果能够更加符合人眼的观测结果,并采用主、客观相结合的方式对实验结果进行了评价。(2)以腹侧和背侧视觉通路的功能分布为依据,分析了场景环境与目标特征对目标检测的影响与作用,研究了自上而下任务驱动视觉注意机制模型化计算建模策略,建立了综合集成式任务驱动视觉注意模型化计算框架,可将目标在场景中的空间位置约束作为先验信息,以缩小搜索空间,进而通过目标特征相关的感知信息驱动视觉注意的模型化计算,实现有效的目标检测。(3)针对远距离拍摄的街道场景中行人目标快速检测问题,设计并实现了一种基于空间环境信息引导的自上而下视觉选择性注意计算方式。可在空间环境信息的引导下,通过对区域特征之间关系的比较,得到目标与环境的依存规则。根据规则推断以实现对目标潜在区域的估计,从而可大大缩减目标搜索空间,进而与通过优选得到的反映目标特征的自下而上感知驱动注意模型相结合,实现了行人目标的高效检测。(4)在深入分析街道场景空间配置结构特征的基础上,提出了一种基于图像全局和局部特征的由粗到精的目标潜在区域预测方法,完善了基于目标环境依存规则的粗粒度区域预测,可为集中注意力提供更加有效的信息。在算法执行过程中,首先对目标所在的垂直区域进行预测估计,并在该预测区域中通过局部特征点的聚类计算得到目标水平位置,进而通过与针对特定目标的自下而上感知驱动注意模型相结合,快速定位候选行人目标。通过提取候选区域的IHOG-LBP特征,运用SVM分类器对其进行分类检测,取得了满意的效果。(5)针对任意距离拍摄的街道场景中行人目标检测问题,提出了一种结合SIFT概率模型的视觉任务导向注意模型,并引入狄利克雷过程对混合高斯概率模型的聚类个数进行估计。此模型采用预注意-集中注意的两阶段检测策略,预注意阶段基于整个场景中目标与场景的底层视觉特征的统计关系建立场景与目标之间关系的混合高斯模型,推断确定目标的空间范围作为目标注意导向信息。集中注意阶段采用目标自显的感知信息驱动视觉注意计算方法得到候选目标区域,并通过后处理得到行人目标的边界外框,以实现有效的检测。(6)面向智能交通视频监控中的车辆和行人目标检测,研究了一种新的针对车牌提取的蓝白对抗特征算式,通过在视觉注意计算模型中引入运动感知信息、目标显著信息(如车牌)、以及环境对目标的空间约束信息等,建立针对不同目标的感知注意计算模型,分别实现了对晴天和阴天环境下路口和路段场景监控视频中车辆和行人目标的有效检测,进而可为路面交通流量分析以及交通状况实时监控提供有效的车辆与行人目标检测数据。本文从自下而上的感知信息驱动和自上而下的任务驱动等多个途径深入研究了视觉注意模型化计算的理论方法和实现算法,并结合街道场景行人目标快速检测、智能交通视频监控系统的车辆和行人目标检测等实际应用背景,检验和验证了文中所提新算法的性能优势,为进一步推广应用奠定了基础。本文的研究成果对丰富和发展视觉选择性注意模型化计算的理论体系和技术实现工具具有重要意义,将在推动复杂环境下图像/视频目标检测技术的工程应用中发挥重要作用。