● 摘要
随着社会的发展和技术的进步,从小范围的公司、零售市场,到大范围户外公共场所,摄像头监控网络在不同的领域都得到了广泛的应用。作为对监控范围内人们的行为进行分析的重要手段,跨视角行人匹配是视频监控领域中一个重要的研究方向。然而,由于视角、光照和行人姿态的较大变化,局部遮挡和低分辨率等问题,设计有效的行人匹配系统就成为一个十分具有挑战性的研究课题。已有的行人匹配方法主要关注特征表达和模型学习两个方面,然而在特征选择、特征噪声信息处理和模型鲁棒性等方面,还有许多问题需要解决。
本文的主要工作是研究了跨视角行人匹配,首先介绍了针对行人匹配的特征提取框架,然后提出了基于结构度量学习的行人匹配方法和基于多核学习的行人匹配方法。
首先,针对跨视角行人匹配,本文应用了两种层次的特征表达方式:低层次特征表达方式和高层次特征表达方式。低层次特征应用广泛,具有代表性,便于评估学习模型的有效性;高层次特征克服低层次特征的缺陷,同时保留了行人外观特征和图像区块间的空间关系。
其次,本文提出了一种基于结构度量学习的行人匹配方法。与传统的度量学习方法相比,结构度量学习从排序序列的层面来优化模型参数,而非基于样本对之间的距离比较;最终学习到的距离度量矩阵是低秩的,也就是输出是稀疏的;同时也可以保证输入的稀疏性,这样就实现对特征中的噪声具有一定的鲁棒性。
最后,本文提出一种了基于多核学习的行人匹配方法。首先将每个特征空间映射到核空间,然后通过多核学习在映射之后的空间里寻找最优距离度量方式,即对特征空间进行优化。最后在优化的特征空间中进行匹配。与已有方法将不同特征统一处理不同,基于多核学习的行人匹配方法通过对不同特征空间分开处理来得到最优特征空间的组合。
同时,我们在两个应用广泛的行人匹配数据库上进行了相关的实验,实验结果表明我们的方法性能上要优于当前主流的行人匹配方法,能够同时保证较高的匹配正确率和模型的鲁棒性。
相关内容
相关标签