● 摘要
本文提出了一种新的机器视觉行为识别方案——主观视角行为识别方案。与传统的视觉行为识别方法不同,本文提出的识别方案将摄像机安放于行为主体本身,以主观视角的方式拍摄行为主体周围的环境,通过分析视频中背景环境的变化情况,逆推行为主体的行为类型。该方案为基于视觉的行为识别理论提供了一条新的研究途径。论文提出了基于运动表达的主观视角行为识别方案:该方案由图像特征提取、运动特征生成、行为特征生成与行为建模识别四个步骤构成。由于摄像机的安装方式特殊,本文论述的主观视角行为识别方案与传统行为识别方案存在较大差异。鉴于此,本文针对主观视角行为识别的关键问题开展了创新性研究,取得了以下研究成果:(1) 提出了一种基于快速滤波与多尺度表达的图像特征描述方法。该方法通过应用空间滤波与多尺度分析,提高了算法对复杂背景的适应能力,解决了主观视角视频中背景尺度变化大的问题;算法对空间滤波方法进行了优化,提高了计算效率,为后续的运动特征表达打下了良好基础。(2) 提出了由稀疏到稠密的两步运动特征提取方案,并相应提出了一种基于改进霍斯道夫距离的稠密匹配方法。首先,进行图像的局部特征匹配,并借助特征唯一性约束与立体成像模型约束去除局外匹配点,获得鲁棒的稀疏运动特征;随后,提出了基于改进霍斯道夫距离的稠密匹配算法,解决了图像匹配的全局优化匹配问题,顺利实现了稠密运动特征的提取。在上述两步方案中,稀疏运动特征既可以直接用来识别行为,又可用于引导后续稠密运动特征提取,实现了由稀疏到稠密、由局部到整体的灵活的运动特征提取方案。(3) 建立了主观视角行为识别模型,并根据行为特征是否包含明确的时域信息,将主观视角行为识别分为“基于直接分类的识别方法”与“基于时空域特征的识别方法”两类。在基于直接分类的识别方法中,论文提出了一种基于统计行为向量的行为特征表达方法,并以支持向量机为例,探讨了学习与识别统计行为向量的方法和过程;在基于时空域特征的识别方案中,论文提出了基于隐马尔科夫模型的行为模型与基于射影运动向量序列的行为模型,并给出了两类模型的识别方法;论文还针对隐马尔科夫模型提出了一种半监督学习方法,能够通过少量有标记数据生成完整的标记数据,提高了模型的识别率与实用性。论文在合作搭建的嵌入式平台上验证了相关算法。实验结果表明:本文提出的方法成功完成了主观视角行为识别任务,能够适应不同的背景环境,行为识别率高;行为识别方案的各个步骤之间衔接紧密,整体运行良好;实验结果验证了本文提出的主观视角行为识别方案的可行性。本论文对主观视角行为识别方法进行了理论研究与实践探索,提出了基于运动表达的主观视角行为识别框架,通过对视频背景变化情况的分析,实现了对不可观测主体的行为识别。本文的研究成果解决了对行为主体的持续监控问题,为主观视角行为识别方法奠定了理论基础,拓宽了行为识别相关理论的实践应用范围,提升了行为识别理论的现实应用价值。
相关内容
相关标签