● 摘要
随着互联网和数字信息技术的发展及广泛应用,数字图像的数量正在快速增长。在海量的数字图像库中,用户常常需要根据应用需求而甄选出某一类别的资源。这种分类应用需求是多层次的,既有注重物体大类别区分的粗粒度分类要求,也有关注物体细节差异的细粒度分类要求。图像分类技术可以对数字图像进行自动归类和区分,是解决上述问题的主要手段。然而,已有的图像分类技术多用于粗粒度的图像分类,没有重点考虑内容相似的图像之间的精细差异,也很难对指定类别的图像做进一步区分,因此无法很好地满足多层次分类需求。如何根据用户的具体需求和图像的内容,精细、准确、高效地对图像进行分类,生成便于用户理解和使用的类别信息,具有重要的理论意义和应用价值。 层次化方法不仅是应用上的要求,也是一种重要的科学研究手段,而现实世界中的概念组织以及人类的认知机制都需要利用层次化分类来进行描述。为此,本论文将单一层次分类扩展为多层次分类,每个层次针对不同的分类目标采用不同的方式来对图像进行分类,形成由粗粒度到细粒度,逐层划分的分类方法,从而降低每层分类的复杂度,减少误分率。在顶层按照一般的物体类别进行区分;随后引入人类对物体的理解方法和机制,从物体局部属性角度,按照物体部件的特点来细化对物体的描述;接着在指定的物体类别内部,从物体整体相似性角度,根据特征的差异和分布特性对图像中物体进行描述,以用来度量类内物体之间的差异;最后综合上述过程形成对图像中物体所属类别的全面刻画,可以较为准确地反映出相似物体的细节差异,使之更接近人类对物体的认知特性。 利用图像底层特征并结合特征频域和空域的统计方法可以对物体图像按照客观世界中的一般性类别进行区分,形成了物体的粗粒度分类。该方法在隐狄里克雷模型的基础上,引入了图像特征的空间位置分布信息,在一定程度上描述出了物体的形状信息以及空间分布,增强了模型的描述能力;同时依据类别约束使不同类别模型的参数空间相互独立,从而避免不同类别模型参数的互相干扰。在常用的图像分类测试集上的测试发现,与未引入类别约束和空间分布信息的分类算法相比,新的分类方法具有更高的准确率。 在对物体进行粗粒度分类后,类内的物体在局部属性上往往存在一定差异,需要对其进行进一步区分。为此引入物体部件模型,按照物体部件之间的属性差异来对物体的局部细节进行区分。该方法从人类对事物认知机制出发,将不同类别的物体抽象为多个部件的组合来进行描述,利用部件的差异对类内物体图像进行分类。在对物体部件进行分析时,结合人类对物体理解的先验知识和图像特征的空间分布来得到物体的部件区域,接着根据不同部件区域所描述的物体颜色,纹理,线条特性,选取相应的特征和模型来对其进行描述。实验表明,该方法能够较为准确地从物体局部细节方面对类内物体进行区分。在对类内物体进行区分时,除了考虑物体局部属性差异外,还需要考虑物体的整体相似性。特征差异是度量物体图像整体相似性的有效方法,矢量量化可以提高特征差异的计算效率。物体粗粒度分类中形成的矢量量化结果可用于描述不同类别间的物体差异,但无法准确地描述类内物体的差异。为此该方法利用主成分分析对同簇内的特征向量进行正交变换,然后对变换结果进行编码并用其描述特征的差异。同时,将图像特征的空间分布引入到特征差异的计算中,将不同图像特征划分到其所属的特征位置空间中并结合空间分布的权重信息来计算物体的整体相似性。经测试发现,在引入特征空间分布和特征编码后,新方法比基于矢量量化和特征欧氏距离的比较算法更为准确。 上述三种方法分别从物体的粗粒度分类层面,物体的局部属性层面以及物体整体相似性层面描述了物体在不同层面的差异,将其结合起来构建出了一种基于多层次综合的物体图像分类算法,能够对物体类别进行全面和具体的描述。实验表明,该方法能够分层次地逐步细化分类结果,可以较为准确地刻画出物体之间的细节差异,并取得更为精确的分类结果。