● 摘要
随着计算机的发展,人机交互技术的研究从以计算机为中心的交互方式逐步转移到以人为中心的多媒体和多种模式的自然交互方式。与其他交互方式相比,手势输入具有自然性、简洁性和直观性的特点,为计算机提供了一种智能化的人机交互接口。基于视觉的手势识别方法根据建模方法的不同分为两种类型:基于表观的方法和基于3D模型的方法。本文的研究工作是围绕基于表观的方法展开的,主要包括:
1. 手势检测
在本文中,手势检测技术主要涉及检测特征、降维方法和机器学习算法三个方面。首先,我们提出了以下检测特征:两种改进的特征NCHOG(Noise Compensated Histograms of Oriented Gradients)和NCLBP(Noise Compensated Local Binary Patterns)、一种新的特征HPCP(Histograms of Pairs of Circumference Pixels)以及几种融合特征。同时,我们研究了HOG参数与实现的优化方法和全角度检测方法。然后,我们研究了重要块选取法和偏最小二乘法(Partial Least Square,PLS)两种降维方法。最后,我们采用支持向量机(Supported Vector Machine,SVM)作为分类器,并研究实现了结合线性支持向量机(Linear SVM)的Adaboost算法。
2. 手势跟踪
考虑到手势在时空上的连续性,我们提出并实现了一种基于双层检测的手势跟踪算法。我们还研究了结合均值漂移的粒子滤波跟踪算法,并提出了一种改进的方法,即利用融合RGB直方图和旋转不变NCLBP特征作为手势目标观测模型。
3. 手势分割与动态手势识别
我们提出并实现了一种结合肤色模型和边缘特征的手势分割方法。对于动态手势识别,我们研究并实现了基于隐马尔科夫模型(Hidden Markov Model,HMM)的手势轨迹识别算法。
4. 手势识别原型系统和一个应用的实现
本文设计并实现了一个手势识别原型系统和一个基于手势控制的图片浏览系统,从而验证本文算法的可行性及优势。