● 摘要
智能视频监控技术是计算机视觉领域的前沿课题和研究热点,由于它能够利用网络实现远程监控,具有非接触性,因此在城市安防、智能交通、军事侦查众多领域得到了广泛应用。行人是视频监控中的重点监控对象,目前对行人的监控大多限于简单的视频回放,人们希望能对视频中出现的行人进行自动的检测、跟踪和检索。行人再识别技术正好满足了这些实际需求,因此需要对行人再识别技术进行深入研究,这项工作具有非常重要的实用价值和意义。
然而,现有的行人再识别技术不能够很好地克服光照变化、视角变化以及多尺度等问题。光照变化使得同一目标的不同图片可能有明显的颜色差异,从而导致误匹配;不同视角导致了行人表观的差异,因为行人身体的某些区域在一个视角下可见,而在另一个视角下有可能被隐藏。这些问题的存在使得行人再识别的识别准确率较低,远远达不到实际应用的需求。因此,本文针对光照变化和视角变化问题展开研究,取得以下成果:
首先,本文提出了颜色拓扑结构来描述颜色在物理空间上的分布。光照变化容易导致行人图片颜色的差异,而相邻子区域平均颜色的差值和相邻子区域在物理空间上的相对位置关系在光照变化下依旧可以保持相对稳定,所以我们利用相邻子区域平均颜色的差值和相邻子区域的梯度来描述颜色在物理空间上的分布,能够较好地克服光照变化。实验数据表明,基于颜色拓扑结构的行人再识别算法与当前其他算法相比,可以有效提升行人再识别的识别准确率。
其次,本文提出了腰间典型区域的概念并利用腰间典型区域进行排除来提升行人再识别的识别准确率。行人上半身衣服和下半身衣服交界处区域的颜色、纹理信息一般都有一定的区分性,把这样的区域称为腰间典型区域。针对不同视角下行人表观不一致的问题,我们发现腰间典型区域在多个视角下均可见且能够保持相对稳定,利用腰间典型区域对返回图片序列进行排除,将腰间典型区域明显不匹配的行人图片降低排名,从而使得正确匹配行人图片能够排名靠前。
最后,本文设计实现了一个由粗到精的快速行人搜索系统。针对系统的快速响应要求,本文利用词包模型建立倒排索引,快速剔除不相关图片以提高检索效率;针对系统的识别准确率要求,本文针对粗筛选后的候选行人目标进行精匹配,利用颜色拓扑结构和腰间典型区域克服光照变化并降低视角问题对识别准确率的影响。实验结果证明了上述算法的有效性,按照本文算法设计的快速行人搜索系统不仅能够快速响应用户的操作,并且具有良好的识别准确率,满足实际项目需求。