● 摘要
基于视觉图像的目标跟踪是计算机视觉领域的一个核心问题,在军事制导、视频监控、机器人视觉导航、人机交互,以及医疗诊断等许多领域有着广泛的应用前景。
视频目标跟踪的研究目的是模拟人类视觉对运动的感知功能,赋予机器辨识图像中运动目标的能力,为视频分析和理解提供重要的数据依据。由于复杂的跟踪背景和目标本身的运动,视频目标跟踪往往非常困难。尽管提出了许多有效的跟踪方法,但是跟踪复杂环境下的目标仍存在较多围难,对算法的鲁棒性和实时性提出更高的要求。
论文基于稀疏表示理论,研究复杂场景下的目标跟踪问题,论文的主要工作如下:
1) 提出了一种基于稀疏表示的改进目标跟踪算法。通过分析表示系数和表示误差的稀疏性,提出了一种新的稀疏表示模型。然后,通过设计合理的初始值,提高优化效率。最后用APG(Accelerated Proximal Gradient)算法对进行优化求解。在模板更新阶段,引入了结构相似度指数SSIM(Structural SIMilarity Index),减少了错误的更新。仿真结果表明,算法的鲁棒性和实时性有了一定的提高。
2) 提出了一种基于最小绝对值偏差(Least Absolute Deviation)理论的目标跟踪算法。首先,针对目标跟踪中不同的干扰,建立了基于拉普拉斯的干扰模型。传统方法利用高斯分布对干扰进行建模,论文通过大量的跟踪视频序列分析发现遮挡、光照变化等干扰的分布接近拉普拉斯分布,从而对干扰建立了拉普拉斯的干扰模型。然后通过贝叶斯最大后验概率理论推导出我们的新优化模型。最后,采用ADMM(Alternating Direction Method of Multipliers)方法来解新模型下的稀疏解。大量实验表明,相比于其他稀疏表示的跟踪方法,新方法在鲁棒性和实时性方面有很大提升。