● 摘要
机器视觉是模式识别领域最具前景的研究方向之一,视频跟踪又是机器视觉的核 心领域,在机器视觉发展之初就成为研究者关注的重要研究方向,现今已经广泛应用 在人机交互、智能监控、导航等军事和民用领域。近年来,视频跟踪算法进入了快速 的发展期,出现了许多优秀的跟踪算法,如 Tacking- Learning- Detection( TLD)算法、 压缩跟踪( Compressive Tracking)算法等,但是这些算法也存在局限性,在复杂背景 情况下,跟踪目标特征信息不充分,目标多姿态并伴随局部剧烈形变,遮挡或光照变 化等(如行人检测),常出现跟踪失效。 本文针对 TLD 算法和压缩跟踪算法在复杂背景下出现的跟踪局限性,进行了深入 学习研究: 1. 为了克服 TLD 算法在目标局部剧烈形变、目标信息不充分导致的跟踪失效问 题,本文在基于 TLD 算法的基础上,加入卡尔曼滤波,提高算法中跟踪模块和检测模 块结果的稳定性,以获取更平滑的结果,提高跟踪鲁棒性,解决了原 TLD 算法在复杂 场景下行人跟踪失败的问题; 2. 为了提高压缩跟踪算法在复杂场景中运动目标的长时间跟踪精确性,本文在该 算法的基础上,提出了利用运动目标的几何拓扑结构之间的关系进行建模的方法,对 运动目标的拓扑结构进行解析,利用拓扑模型子块间关系对目标进行分块并对每一子 窗口进行特征提取,同时判断窗口之间的拓扑关系,利用整体目标与子窗口之间的拓 扑图形制约关系对整个目标进行跟踪,跟踪同时对每个子窗口引入置信度机制,使其 具有不同的权重,保留了目标的空间信息。实验结果显示,该方法能适应目标多姿态 局部的剧烈变化,实验结果具有较强的鲁棒性,实现了复杂场景中运动目标的长时间 跟踪的精确性; 3. 压缩跟踪算法加入拓扑模型后,计算复杂度成倍增加,本文提出了算法优化方 法,采用分层采样策略, 在不同阶段采用不同的扫描采样策略,提高采样扫描的效率, 减少多余的采样计算,同时增强更具目的性的采样扫描的精度,以提高跟踪结果的精 确性。