● 摘要
随着以无人机为代表的各种航空飞行器技术不断进步,航拍视频、图像已广泛应用于军事领域和民用领域。同时,可获取的航拍视频分辨率不断提高、数据量飞速增加、应用需求增多,航拍视频数据的处理和智能分析面临新的挑战。近年来航拍视频分析得到了研究者的广泛关注和深入研究,但是仍有很多理论与技术问题亟待解决,比如,如何有效的解决航拍场景分类问题。有鉴于此,本文围绕航拍图像场景分析类中的关键技术展开研究,提出了两种航拍场景分类算法框架,一种为基于监督型的航拍场景分类算法,另一种为基于非监督型的航拍场景分类算法。本文主要工作如下: 1) 深入分析了场景分类算法,并针对如何解决航拍图像的场景分类问题进行了剖析。 2) 提出了一种监督式航拍场景分类算法,其主要创新点是考虑并解决航拍图像中底层特征与高层语义的不匹配问题。此算法运用加入隐藏层的方式来表达中间语义,即中间特征,用此来连接低层特征和高层语义。整个算法流程的训练部分可以分为四大步骤:特征提取、特征整合、视觉词袋表示、深度信念网络学习。而在测试步骤中,只有特征提取和深度信念网络测试两个步骤。在测试中深度信念网络参数已经完全学习完成,因而算法时间复杂度也较低。此算法在六类别的数据库中取得了良好的结果。 3) 提出了一种非监督式航拍场景分类算法,其主要创新点在于能够自动选择合适于航拍图像场景分类问题的特征。而非人工手动的设定要提取的特征。首先运用了深度学习的方法来自动提取特征。深度学习具有非监督的特性,在层与层之间进行贪婪式的学习,并逐层提取、提升特征。最后再利用这些低层特征,运用空间金字塔匹配算法进行特征的提升,进而利用SVM分类器进行分类。此种方法在21类航拍图像库中取得了优于梯度、SIFT、SPM等算法的识别率。 4) 提出了针对非监督式航拍场景分类算法的改进算法。此方法取得了不仅优于传统方法的识别率、而且比改进前算法也有大幅提高。