● 摘要
遥感影像中建筑物目标具有高度多样性和复杂性,成功的建筑物识别系统将为其他类型的影像理解问题提供具有普遍指导意义的理论和方法。从单幅遥感影像中提取建筑物策略一般可分为边缘驱动策略和区域驱动策略,边缘驱动策略只适用于规则房屋的提取,区域驱动可提取出结构相对复杂的建筑物,但是提取出的建筑物在很大程度上依赖于图像分割结果。文中主要研究遥感影像的图像分割方法,为区域驱动的建筑物提取做好基础工作。
图像分割是图像处理中一个基本而关键的环节,目前已提出很多图像分割算法,但由于遥感影像内容丰富,具有目标小,类型多,噪声大等特点,适合遥感影像图像分割的算法并不多。近年来提出的主动轮廓模型用数学模型来表征图像分割问题,可以将边缘、纹理、灰度、色彩等低层视觉属性和先验形状、色彩的经验统计等经验知识融为一体,对一系列的计算机视觉问题给出了统一的解决方法。因此,该方法在图像分割领域受到了越来越广泛地研究和应用。主动轮廓图像分割模型的基本思想是定义一条或多条封闭的初始轮廓线(初始曲线),并定义有关图像信息的能量函数,最小化这个能量函数,然后驱使轮廓线不断地形变(演化)并在图像的某种特征(如梯度)处能量达到最小。这种模型求解时首先将能量函数用所选用的曲线演化方式表示出来(或者用参数化形式表示曲线或者利用水平集方法间接地表示曲线),然后利用变分法最小化能量函数,得到一个有关偏微分方程(PDE),最后使用离散化后的PDE方程驱动轮廓线迭代地演化。主动轮廓模型主要包括参数化主动轮廓模型和几何主动轮廓模型,参数化主动轮廓模型直接以曲线的参数化形式表达曲线的变形,难以处理曲线演化过程中的拓扑结构变化的问题,几何主地动轮廓模型用水平集函数间接地表达平面曲线的变形,水平集方法在形变过程中始终保持为一个连续的函数,容易处理拓扑结构变化的问题,且具有可靠的数值求解方法。本文主要讨论几何主动轮廓模型,将其应用于复杂遥感影像的建筑物提取。
本文首先介绍水平集方法的基本理论和几种典型的几何主动轮廓模型;其次讨论了基于Mumford-Shah模型的C-V模型;然后提出基于Bayesian理论的几何主动轮廓模型;最后提出一种快速的基于区域竞争的主动轮廓图像分割模型。本文的主要创新点是:
(1)在分析C-V模型的基础上,针对传统水平集方法在演化过程中需要不断地重新初始化的问题,对C-V模型进行改进,提高了曲线的演化速度,同时解决了传统水平集方法中何时初始化和如何初始化的问题。
(2)提出一种基于Bayesian理论的主动轮廓模型,该模型从数理统计的角度上描述了C-V模型,是一种更广义的主动轮廓图像分割模型。首先利用Bayesian理论推导出最大后验概率(MAP)公式,定义有关MAP的能量函数,然后用几何主动轮廓对其最优化。为了将其应用于彩色图像分割中,并充分利用颜色间的相关性,采用多元正态分布描述区域信息。该模型易于综合纹理,形状等多种信息对模型进行扩充,对于不同类型的图像可选用不同的概率模型。
(3)提出一种快速的基于区域竞争的多类图像分割模型。利用区域竞争曲线演化策略来表征任意类别数的图像分割问题,并保证轮廓曲线在演化过程中所得到的分割区域互不重叠,推导出一种新的快速曲线演化偏微分方程,与现有的一种曲线演化偏微分方程相结合,在提高曲线演化速度的同时保证了图像分割的精度。该模型可以实现预先知道目标类别数,但目标形状可以任意,且同类目标可以不连续的多类目标分割,既适用于彩色图像分割又适用于灰度图像分割。此外,能量函数和曲线演化方程是相对独立的。