当前位置:问答库>论文摘要

题目:工业现场快速OCR技术研究

关键词:OCR,快速中值滤波,字符分割,多级特征, OCR性能测评系统

  摘要



 随着信息技术的迅猛发展,OCR(Optical Character Recognition,光学字符识别)系统作为计算机智能接口的一部分,在各行各业获得了日益广泛的应用,但是传统的OCR技术在某些特殊的应用场合已经不能满足实际的工程需求,因此研究特定情况下的字符识别将对这一领域的发展起到积极的作用。通过对工业现场的激光镭雕字符识别方法的理论分析和实验,本文研究了工业图像预处理、字符分割、小波矩、多级字符识别器以及算法的实际应用等几个方面。

        (1)针对工业现场的强干扰性和工业图像的背景复杂性,本文采用彩色图像灰度化、图像增强、二值化等多种图像预处理算法,针对预处理中常用的中值滤波耗时较长的问题,提出了一种基于窗口边界带的快速算法,使算法的复杂度由原来的O(D2)降到了O(D)。针对非均匀光照图像提出了一种双窗口自适应二值化算法。通过对工业图像的实验结果分析,实现了具有良好的预处理效果。

        (2)针对工业图像字符排列紧密,间距不均,背景干扰等问题,本文研究了字符间隙法、垂直投影法、连通区域法等多种字符分割方法,提出了一种整体标记、局部筛选的连通域字符分割方法。通过对字符图像的实验结果分析,实现了工业图像OCR字符分割的最优化设计。

        (3)特征提取和分类器设计是本文研究的重点,特征提取模块设计了两级特征。一级特征融合了字符的统计特征和结构特征,对于字符局部畸变,笔画粗细不均等问题具有很好的适用性,二级特征采用小波矩,对于相似字符具有很强的区分能力和抗噪性。分类识别模块首先基于一级特征进行模板匹配,然后采用二级融合特征对一级分类结果前5位模板进行二次匹配。实验表明,两部分相互配合,获得了较为满意的识别效果。

        最后,提出了一种OCR技术性能测评系统设计方案,对于软件框架与设计进行了详细的介绍,并与工程项目相结合,利用Visual C++ 平台,基于ACCESS数据库,开发了一套实际的应用系统,将整个识别算法移植到该系统,获得了较为满意的测评效果。