当前位置:问答库>论文摘要

题目:档案图像处理技术研究

关键词:档案图像;档案图像信息系统;图像处理;倾斜校正;图像增强;图像压缩;图像二值化

  摘要

伴随信息技术的进步,档案数码化已成为档案管理工作的必然要求。数码化后的扫描档案存在诸多图像质量问题,对这些图像进行处理,使之更好地满足应用要求,就变得十分必要。档案图像要求较高的空间分辨率和较低的颜色分辨率,档案图像具有符号级冗余和高度结构化的版面,档案图像具有纹理粗糙性,利用档案图像的这些特点,对档案图像进行倾斜校正、图像增强和图像压缩是本文研究的主要内容。研究取得一定成果,具体包括:(1) 提出了一种基于行结构分析的档案图像倾斜校正算法倾斜校正是档案图像处理与分析的首要步骤,校正效果往往对后续图像处理产生重大影响。首先通过使用多尺度的高斯滤波器平滑输入图像,获得最佳的档案图像行结构;其次引入线性结构张量对行结构进行分析,获得各像素点的行似然信息;然后对满足行似然条件的像素点,确定其行结构的局部方向;最后统计图像所有具有行结构的局部方向,得到整幅图像的倾角,并进行图像校正。实验表明,该倾斜校正方法对具有多种语言、多种字体的文本富裕档案具有鲁棒性。(2) 提出了一种CLAHE和细节增强相结合的档案增强算法图像增强的主要目的是改善档案图像的视觉效果,它对档案图像信息系统的有效利用至关重要。通过运用自适应直方图均衡化技术从整体上调节图像的灰度分布范围,运用Lee滤波器从局部上增强图像细节,应用图像噪声限幅策略抑制图像噪声,从而使得增强后的档案图像满足国家的行业规范。实验表明,采用上述三种技术有效结合的方法,能够有效改善经扫描方式批量生产获得的档案图像的质量。(3) 提出了档案图像压缩的两种方法一是基于五阈值二值化的档案图像压缩方法。二值存储是扫描档案图像压缩的重要途径,即扫描灰度图像二值化后经熵编码再存储。针对扫描过程出现的噪声和二值化过程出现的断笔划与伪影问题,本文应用全局和局部阈值相结合的方法,针对存在的问题分别定义对应阈值,并且使得这些阈值具有图像细节自适应能力,最后综合应用这些阈值对档案图像二值化。实验表明,本文提出的方法能够有效解决断笔划和伪影问题,能取得比较理想的二值化结果。二是基于模板的档案图像压缩方法。在档案图像信息系统中,信息冗余不仅存在于像素级、符号级和页面级,而且存在于页间级,有效降低页间级的冗余性是系统压缩的重要渠道。本文通过模板定义相似档案图像集合,利用模板的性质将相似档案图像分割为信息易变区域和信息稳定区域,对信息易变区域采用适合区域种类的页内压缩方法降低页内冗余,对信息稳定区域采用本文提出的模板差分集合冗余压缩技术降低页间冗余,两者相结合形成基于模板的压缩方法。实验表明,基于模板的压缩方法能有效降低档案图像信息系统的整体冗余量。