● 摘要
汉字图像的识别涉及到模式识别、图像处理等学科,是一门综合性比较强的技术,在中文信息处理,办公自动化,人工智能等领域,都有着重要的应用价值和理论意义。基于统计的、结构的和近些年提出的统计和结构相结合及集成方法都有了很充分的研究工作,使得汉字识别技术得到了快速的发展,汉字识别效果进一步的被完善。在汉字部件识别方面,有基于图像统计特征的研究工作,但是统计结构方法在这上面的应用并不多见。在考虑了汉字识别上统计结构方法的集速度与识别率于一身的优点后,本文在基于统计结构建模的汉字识别技术的基础上开展研究工作,将汉字部件进行统计结构建模,并依据建模结果,完成对于输入汉字的部件识别和提取操作,同时对汉字的结构信息进行检测。本文来源于实验室课题“汉字构形演化数字化技术与系统”,研究如何利用统计结构建模的思想对汉字进行部件的识别,以及部件识别之后的部件分割与结构判定,主要研究内容如下:1.基于统计结构思想的汉字部件建模给定标准汉字部件图片,首先要寻找方法去标注标准的笔画。本文从骨架入手,在对部件图像进行细化和骨架提取之后,介绍以交叉点、端点为关键点并据此寻找初始笔段的方法。进而由用户手工标注,形成标准笔画后,本文采用Gabor滤波来表征笔画的方向属性,并利用高斯模型对笔画进行建模。最后介绍了为近似结构关系而采取的邻居选取策略,结合局部特征的提取,完成整个对于汉字部件的标注工作。2.基于最优组合策略的部件识别方法在已经得到标注好的标准汉字部件后,下面将要解决的问题是如何对输入的汉字进行部件的识别。由于输入的汉字图像可能存在一些问题,所以在开始阶段介绍如何对汉字图片进行有效的预处理,使得预处理之后,得到的汉字图像能更有效的支持部件识别。介绍过预处理后,本文主要对如何生成目标部件中标注笔画的候选笔画进行了说明,并描述了如何在得到候选笔画集合后构建搜索图并完成可能部件的查找工作的相关内容,最后在得到各个部件可能解的前提下,提出最优的组合策略来避免单一阈值识别的缺陷,完成汉字部件识别过程并输出输入汉字的部分骨架与目标部件骨架的对应关系。3.汉字部件分割与结构判定在前面的章节介绍如何做部件识别操作后,事实上得到的只是输入汉字中存在哪些部件,以及输入汉字中的笔画与目标部件对应关系。因此,本文采用寻找轮廓和骨架对应的方法来完成部件的分割,随后说明已经定义的13种常见汉字结构模板,进而引入汉字的黄金格构型理论,利用九个宫格的不同的占用情况来区分部件之间的结构关系。最后将输出汉字的部件分割结果,并得到汉字的层次结构。最后,本文基于前几个研究内容,实现了一个部件笔画标注和汉字部件识别与结构判定的原型系统。系统中集成了基于统计结构建模的汉字部件描述、基于最优组合策略的部件识别方法、利用寻找骨架和轮廓对应的方法和基于黄金格理论的结构判定,整体上实现了对于输入汉字图片的部件识别与结构判定的功能。