● 摘要
人脸识别是生物特征识别领域颇具有挑战性的一个研究分支。一方面,它汇聚了诸如模式识别、图像处理、人工智能、计算理论、信号处理、图形学、统计学与信息安全等方面的专家和研究人员多年来进行关注和研究。从而使相关领域和学科能够在这一研究过程中得到相互融合与促进;另一方面,人脸是人类情感表达和交流的最重要、最直接的载体。它的无侵害性和对用户自然、直观的特点使之成为最容易被人接受的生物特征识别方式。视频中的人脸识别是人脸识别研究的一个分支。视频序列中信息的丰富性为身份识别研究人员带来“如何进一步提高人脸识别率”的巨大吸引力。同时,视频中人脸识别面临的诸如视频分辨率较低、人脸姿态变化、环境光照带给人脸的阴影、可能出现的遮挡等等也给该研究提出了更高的要求。围绕这些挑战,论文对视频中人脸识别的关键技术进行了文献综述和相应问题处理方法的研究。文中围绕视频人脸的预处理、低分辨率处理、光照影响的有效降低、姿态可变性方面的处理以及视频上下文信息的利用等方面的关键技术做了如下具体工作:1. 首先,本文对前人近二十年来在视频中人脸识别面临的光照、姿态变化以及低分辨率等课题方面的研究成果和进展进行了综述;分门别类地对于研究现状进行了分析汇总并给出研究的热点和难点。同时,在文中以列表的形式给出了现有的衡量视频中人脸识别效果的基于视频的人脸数据库的介绍。2. 围绕视频中人脸的预处理技术,提出了先进行AHE(自适应直方均衡化)增强,再进行基于滑动窗口分割视窗的检测与跟踪,最后进行基于ASM的效果精化以及人脸对齐的预处理方法。实验证明,该方法对一定程度消除视频中出现的光照影响以及由于人脸尺度变化带来的识别影响有效。3. 针对视频采集时发生的低分辨率图像问题,提出了一种人脸图像评价的方法,并结合马尔可夫模型给出改进的加权马尔可夫超分辨率处理模型。本文提出的模型经过实验验证,具有时效性较高的优点。4. 提出了一种能够较好地提取视频中多姿态人脸特征并进行识别的模型。该模型主要借助嵌入式隐马尔可夫链和Gabor小波变换来建立人脸的观察序列,采用多个HMM对个体进行多姿态特征提取。该模型在Sheffield人脸数据库上实验验证了该方法的有效性。同时通过与现有的DCT+HMM以及DWT+HMM的方法在Sheffield上的比较实验证明,该模型能够在人脸可变姿态下鲁棒地提取面部特征,因此在视频中与姿态无关的人脸识别方面可以达到良好的效果。5. 提出了一种结合使用自适应直方图均衡(AHE), Gabor滤波器以及局部三值模式(LTP)描述器, 进行视频中上下左右和正面光照条件下识别人脸的新方法AHEGLTP。通过在YaleB人脸库以及CMU PIE人脸库上进行验证,该方法效果显著。6. 提出了一种基于贝叶斯网络的解决视频上下文问题的识别模型,并实现了一个无监督的基于视频上下文的人脸识别系统。该系统通过结合多角度的人脸检测和滑动窗口光流跟踪,实验证明能够在复杂的开放环境下进行有效的人脸跟踪。整体系统通过Honda/UCSD数据库进行实验,结果表明,该系统可以在实时的视频中对人脸进行鲁棒跟踪和无监督的分类识别。