灰度图像中字符切分方法的研究

陈艳,孙羽菲,张玉志

PDF(413 KB)
PDF(413 KB)
中文信息学报 ›› 2004, Vol. 18 ›› Issue (4) : 45-50.

灰度图像中字符切分方法的研究

  • 陈艳1,2,孙羽菲1,2,张玉志1
作者信息 +

A Study on Segmentation Method for Gray Document Image

  • CHEN Yan1,2,SUN Yu-fei1,2,ZHANG Yu-zhi1
Author information +
History +

摘要

字符切分目前已经成为限制OCR技术发展的瓶颈,对于图像质量较差、中英文混排和背景色变化的文本图像,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理,再根据分级连通域的概念把整个图像构造成树状结构,然后确定主层次级别,根据一定的规则在部分节点上进行合并、分割等进一步处理,最后得到最优的切分结果。实验结果表明,该方法能够取得比常规切分方法更好的切分效果。

Abstract

In order to overcome the weakness of conventional segmentation algorithm in OCR , this paper presents a new segmentation method for gray document image. Important features of the new method include grading of the grayscale of pixels in image and construction of a tree structures for the whole document image. By dividing this tree's branches and leaves , characters , pictures and forms can be correctly segmented. The experiment results showed that this method is very effective for document with both Chinese and English characters or document with different backgrounds.

关键词

人工智能 / 模式识别 / 字符切分 / 灰度图像 / OCR

Key words

artificial intelligence / pattern recognition / character segmentation / gray image / OCR

引用本文

导出引用
陈艳,孙羽菲,张玉志. 灰度图像中字符切分方法的研究. 中文信息学报. 2004, 18(4): 45-50
CHEN Yan,SUN Yu-fei,ZHANG Yu-zhi. A Study on Segmentation Method for Gray Document Image. Journal of Chinese Information Processing. 2004, 18(4): 45-50

参考文献

[1] Sankur B , Sezgin M. Image Thresholding Techniques : A Survey over Categories[R] . a technique report of 2001.
[2] Casey R G, Lecolinet E. A Survey of Methods and Strategies in Character Segmentation[J] . IEEE Transactions on Pattern Analysis and Machine Intelligence ,1996 ,18 (7) :690 - 706.
[3] 吕凤军. 数字图像处理编程入门[M] . 北京:清华大学出版社,1999.
[4] 张炘中. 汉字识别技术[M] . 北京:清华大学出版社,1992.
[5] 朱军明,黄磊,刘昌平. 图像二值化方法的比较[A] . 第八届全国汉字识别学术会议论文集[C] ,110 - 116.
[6] 徐蔚然,于武贵,郭军. 基于统计方法的混排文字切分与分类[A] . 第八届全国汉字识别学术会议论文集[C] ,123 - 129.

基金

863计划资助项目(2003AA1Z2230);科技部中小企业创新基金资助项目(01C26214420207);计算所领域前沿青年基金资助项目(20026180-19)
PDF(413 KB)

Accesses

Citation

Detail

段落导航
相关文章

/