当前位置:问答库>论文摘要

题目:彩色自然图像中任意方向的文本检测

关键词:文本检测, 笔画宽度变换, 自适应二值化, 局部笔画宽度变换

  摘要



当今社会是信息高度发达的时代,多媒体信息量飞速增长。图片作为信息的重要载体,包含巨大的文字信息量也不言而喻。因而文本定位与识别技术一直以来都是图像处理、计算机视觉领域的一个重要研究课题,具有很大的应用价值。图像中文字的提取在中国人的工作生活中有着广泛的实际应用。自然场景文字是指摄像机或照相机拍摄过程中,被这些输入设备直接拍摄下来的场景中的文字。在自然场景图像中寻找文字区域很有必要,这些文字数据承载着人们日常生活中的非常有用和重要的信息,如街道牌、广告牌、交通指示牌等。使用我们身边的便携设备提取、识别并记录,乃至上网搜索相关内容,可以大大方便我们的生活。在自然场景有文本有它自己的特点,如语言、字体、颜色、大小、方向等方面。因此自然场景中的文字识别需要与自身特点相适应的研究方法,同时,保证一定的文字提取成功率,在实际应用中将有很好的前景。 在现有的技术中主要有3个基本方法,即根据颜色相关性的连通域方法、运用机器学习进行图像纹理分析的方法、根据图像文字与背景对比度的检测边缘方法以及它们的综合应用方法。基于连通域的方法原理相对比较直观,只适合处理背景比较简单的图像;基于纹理分类方法的基本思想是将文字区域作为一种特殊的纹理对象来考虑,其检测精度可以很高,但需要对整幅图像进行扫描和纹理分割,事先需要进行大量训练,计算代价比较高,检测效果也与训练样本有很大关系;基于边缘的方法首先以边缘算子检测出边缘再进行计算,容易产生较高的虚警。因此,如何有效地滤除背景边缘需要较多的后续处理。 本文所用的方法结合了文字自身的特点,提出一种基于局部笔画宽度变换的文本检测系统,首先使用自适应二值化方法将原图处理成二值图像,然后将各个连通区域作为候选部件,并计算笔画宽度值图。最后通过一系列滤波器之后将留存的部件连接成文本行。本文所述的方法在ICDAR2011数据库上具有较高的文本检测准确性。