● 摘要
动态场景中运动目标检测(Moving Object Detection in Dynamic Scene)是指通过分析由运动摄像机在不同时刻、不同位置拍摄的连续图像序列中包含的运动信息,将拍摄场景中的独立运动目标从每一帧图像中检测出来。由于摄像机在不停地运动,因此,其采集的连续图像序列中包含有两种运动信息:摄像机的运动信息和拍摄场景中独立运动目标的运动信息。在每一帧图像中这两种运动信息混合在一起使得运动目标检测变得更加复杂和困难。但是,在我们的现实生活中,由移动设备采集的连续图像序列随处可见,且这一技术尚处于发展阶段。因此,在不久的将来,这一技术将具有更加广泛的应用领域和良好的发展前景。目前,动态场景中运动目标检测技术广泛应用于智能视频监控、基于内容的视频检索、移动机器人视觉导航、自动驾驶等多个领域。所以本文具有非常重要的学术研究意义和实际应用价值。
迄今为止,已有的运动目标检测算法大多只适用于摄像机静止的情况,即静态场景中运动目标的检测,只有很少一部分检测算法能够适用于摄像机运动的情况,即动态场景中运动目标的检测。这些算法大致可分为:扩展的帧间差分法、扩展的背景差分法和扩展的光流法。由于扩展的帧间差分法在估计摄像机运动参数时采用了特征匹配技术,因此,其应用范围受到了极大的限制,一般仅适用于纹理信息丰富、有明显特征的场景。扩展的背景差分法在构建全景背景模型图像时采用了图像配准技术,由于该技术易受到视差的影响,因此该检测方法没有得到广泛应用。扩展的光流法由于计算复杂和易受噪声影响而没有得到广泛的应用。为了克服已有算法的不足,本文提出一种新的动态场景中运动目标检测算法,该算法将利用由相邻两帧图像计算得到的法向流场来检测当前帧图像中的独立运动目标。该算法对噪声敏感度较低,对拍摄场景的纹理特征没有任何约束,因此适用场景比较广泛,具有很重要的学术研究价值。
本文提出的算法主要用于检测由运动摄像机拍摄的连续图像序列中的独立运动目标,即检测动态场景中的独立运动目标。该算法首先利用由相邻两帧图像计算得到的法向流场,估计得到摄像机运动信息;然后结合当前帧图像的彩色分割结果图,得到一个初始标记场;最后利用马尔科夫随机场理论对初始标记场优化问题建模,得到合适的目标能量函数,再采用图割优化算法求解该目标能量函数,从而得到当前帧图像的最优标记场。经过以上步骤,即可检测出当前帧图像中的独立运动目标。由于在估计摄像机运动信息时,本文算法仅利用了法向流矢量场的方向信息,因此,本文算法对噪声敏感度较低,且对拍摄场景纹理特征没有严格的约束。