当前位置:问答库>论文摘要

题目:基于半监督支持向量机的图像分类方法研究

关键词:半监督学习;支持向量机;均值漂移;标签均值;复合核;图像分类

  摘要


支持向量机是根据专门研究小样本情况下机器学习规律的统计学习理论发展起来的一种监督的机器学习方法,追求在有限样本信息的条件下得到最优结果的同时,解决了维数灾难和非线性分类等机器学习中普遍存在的问题,被认为是一种高效的、有着优越表现的分类器,基于支持向量机的图像分类也成为图像分类问题中的一个重要的理论和技术。然而,通常大量携带着正确标签的标记样本的获取是比较困难的,采用其训练的分类器的效率和有效性也会相对较低,因此,半监督支持向量机算法因其考虑将半监督学习的思想和支持向量机分类方法有效结合,通过利用少量标记样本和大量无标记样本共同训练支持向量机,而得到了更多的关注,将半监督支持向量机算法应用到图像数据分类的研究中也是必要的。

本文从半监督支持向量机在图像分类中的应用展开深入研究,充分挖掘算法在图像分类中的潜力和优势。针对算法应用于图像分类中复杂度较高、内存溢出、稳定性较差、分类正确率较低等一系列问题,提出了两种图像分类的方法。本文研究的具体工作如下:

1、提出基于均值漂移的标签均值半监督支持向量机的图像分类方法。标签均值半监督支持向量机算法在图像分类中,随机选取少量无标记样本参与训练分类器的分类正确率较低,而选取过多的无标记样本的算法复杂度则会较高;此外,算法重要参数的取值采用经验估计的方法,应用到图像分类中会导致算法的波动性较大。针对上述问题,提出了基于均值漂移的标签均值半监督支持向量机的图像分类方法。该方法结合均值漂移算法,将其平滑后的图像作为分类对象,以降低待分类图像特征的多样性;在每一个平滑区域中随机选取一个样本构成无标记样本集,以保证其携带对分类有用的信息,使分类器可以更好地利用无标记样本的信息并获得极大的性能提高;对参数的取值进行了探讨,结合均值漂移的结果改进了算法重要参数的取值方法,以获取更优更稳定的分类结果。理论分析和实验结果表明,该方法在图像分类中达到了较高的分类正确率和时间效率,改进的参数取值方法有效地避免了算法对图像分类的波动性。

2、提出基于Mean Shift聚类参数自适应的半监督复合核的支持向量机图像分类方法。基于半监督复合核重构的支持向量机算法在构造聚类核时,普遍存在复杂度较高、不适用于规模较大的图像数据分类等问题;另外,采用K-means算法对图像进行聚类时,参数k的取值是难以估计的,并且聚类的时间复杂度会随着数据量的增大而急剧增加。针对以上问题,提出了基于Mean Shift聚类参数自适应的半监督复合核的支持向量机图像分类方法。该方法结合了Mean Shift图像聚类算法对像素点进行聚类分析,避免了K-means算法对于图像聚类的局限性;自适应Mean Shift算法的参数hs和hr,结合图像的结构特征自动调整聚类的距离和方差,得到合适的聚类结果,避免了因经验固定参数而导致的算法稳定性降低的问题;最后根据Mean Shift图像聚类结果构造Mean Map聚类核,利用均值映射的思想增强同一聚类中的样本属于同一类别的可能性,再构造半监督复合核函数,指导支持向量机对图像分类。仿真实验验证了该图像聚类方法和参数自适应策略可使算法更好地获取图像的聚类信息,从而使构造的半监督复合核指导支持向量机进行图像分类能够更高效更稳定。