当前位置:问答库>论文摘要

题目:面向场景理解的暴力视频检测算法研究与实现

关键词:人体行为识别;场景理解;时空兴趣点;词袋模型;支持向量机

  摘要

人体行为识别属于计算机视觉高层视觉分析部分,提取视频中的高层语义是一个极具挑战性的课题,涉及图像处理、人工智能、模式识别等领域的众多核心课题,是近几年计算机视觉领域发展的最热门方向。行为识别的主要目的是从视频中识别出人体行为的类型,人体行为识别技术在许多领域都有着广泛的应用前景,其中包括计算机智能视频监控系统、智能人机交互、运动分析、基于视频内容的自动化标注系统、视频多媒体检索等领域,对计算机智能化发展及各交叉学科都有着重要的意义。本文对当前人体行为识别相关算法及技术进行了深入的分析与研究,在对比分析国内外在该领域研究成果的基础上,给出了一种面向场景理解的基于时空兴趣点的暴力视频检测方法:由于场景信息与视频暴力信息具有关联性,场景信息对暴力信息的提取与检测具有先验知识推导作用,不同的场景下的暴力视频的定义不同,故可以根据不同的场景信息,采取不同的暴力视频信息提取及检测方法;该方法主要包括三个部分:(1)对视频关键帧进行SIFT特征提取,采取词袋模型对所提取的SIFT特征进行高层语义抽取,使用SVM支持向量进行场景信息识别。(2)采取改进的时空兴趣点过滤算法进行待检测视频的时空兴趣点提取,融合方向梯度直方图,改进的光流直方图两种局部特征向量及全局特征运动能量图特征作为人体行为特征描述算子,并采取词袋模型提取时空兴趣点特征向量的高层语义。(3)给出两种面向场景理解的暴力视频检测模型:串行模型及并行模型。串行模型:根据场景语义信息,及场景语义-暴力事件先验知识库选择不同暴力事件特征提取器及分类器;并行模型:将场景语义信息及视频的暴力信息进行融合,进行检测。论文最后使用KTH人体行为库进行了人体行为识别的相关实验,验证了论文提出的基于时空兴趣点和多特征融合的人体行为识别方法的有效性;并通过采集互联网上相关的暴力视频进行场景理解及面向场景理解的暴力视频检测的相关实验,给出了实验数据,验证了面向场景理解的暴力视频检测方法的可行性及良好的识别效果。