● 摘要
三维模型检索与分类算法的性能,与模型的特征表示(Representation) 有着紧密的
联系。传统的特征表示主要是人工设定的(Handcrafted),依靠的是该领域研究人员的
先验知识。由此得到的特征往往不能全面的表征整个模型,导致三维模型检索与分类
远远没有达到理想的效果。本文着眼于三维模型的特征表示,将研究内容主要分为两
部分:一是研究一种将多个三维模型特征融合一个超级特征(Hyper-feature),另外一个
是利用无监督的深度学习方法来提取三维模型的高层抽象特征。
目前,三维模型领域有一个共识:整合多个特征往往能够提高模型检索与分类的
效率。但是融合的方式往往对最终得到的特征的性能有很大影响。本文提出一种新颖
的将多个三维模型特征整合成一个特征的机制,该机制能够根据不同的特征提取算法
的表现,以一种提升的方式(Boost-manner) 调整不同特征提取算法的在融合特征的权
重,权重的学习过程利用了基于标注传播的图学习算法,是一种半监督学习方法。
最近的研究表明深层结构模型具有着强大的拟合输入数据分布的能力,本文提出
了基于深度学习的三维模型的检索与分类的框架。关键的步骤是利用无监督的深度学
习方法进行三维模型的特征提取。首先向深度模型输入无标注的数据,然后进行贪心
的逐层训练每一层,最后抽象的表示可以从深度模型的最后一层得出。根据采用深度
模型结构的不同,该部分又可以分为两部分,一是利用现有的深度模型:深度信念网
络(Deep Belif Network)深度玻尔兹曼机(Deep Boltzmann Machines)提取三维模型的
抽象特征。二者的结构不同,训练算法也有不同,本文对它们的训练算法给出了详细
的阐述。另外,还提出了一种针对基于视图的三维模型的特征提取与分类的深度模型,
称为3D 卷积神经网络(3D Convolutional Neural Networks) 该模型一次将一个模型的全
部视图作为输入,得到一个三维模型的整体特征。训练该模型先采用的是逐层训练的
方法预训练神经网络,得到三维模型的抽象特征,然后利用back-propagation 进行整个
网络的训练,最后得到一个三维模型分类模型。
另外,本文还对深度模型的超参的设置、训练技巧进行了探究,目的是找到适合
的三维模型特征提取的深度学习模型。为了检验本文所提算法,在公开的三维模型库
(PSB,NTU,SHREC’09)上的做了大量的试验,试验表明本文所提算法能够较好的
处理三维模型的分类与检索问题。
相关内容
相关标签