多字体印刷维吾尔文的切分

哈力木拉提,丁晓青

PDF(121 KB)
PDF(121 KB)
中文信息学报 ›› 1997, Vol. 11 ›› Issue (3) : 36-41.

多字体印刷维吾尔文的切分

  • 哈力木拉提,丁晓青
作者信息 +

The Segmentation of The Multi-Font Printed Uygur Characters

  • Halmurat, Ding Xiao Qing
Author information +
History +

摘要

在许多文字识别系统中, 字符切分是预处理阶段的一部分, 其目的是从文本图象中分离出字母图象。而后才能针对切分后的每个字母进行识别。在具有连体特征的文字中, 字符切分就显得特别重要, 因为字符切分的准确与否直接影响字符的识别。维吾尔文就具有这种明显的连体特点, 本文主要讨论了采用抽取投影特征的方法, 实现了多字体维吾尔文的行切分、字切分和字符切分。

Abstract

In many OCR systems , character segmentation is a necessary phase for character recognition. it is very important and difficult to segment characters in cursive script characters , because the incorrect segmentation affects the result of the characters recognition. Uygur characters are featured with cursive script . In this paper , we present a method of segmenting Uygur printed characters that is based on the projection of character image , to realize segmentation of line 、word and characters from a scanned image page.

关键词

维吾尔文 / 连体字符 / 字符切分 / 文字识别 / 投影 / 特征 / 草书

引用本文

导出引用
哈力木拉提,丁晓青. 多字体印刷维吾尔文的切分. 中文信息学报. 1997, 11(3): 36-41
Halmurat, Ding Xiao Qing. The Segmentation of The Multi-Font Printed Uygur Characters. Journal of Chinese Information Processing. 1997, 11(3): 36-41

参考文献

[1] 赵泊璋 张松芝 中文信息处理技术 1990年 宇航出版社
[2] 吴佑寿 丁晓青 汉字识别原理方法与实现 1993年 高等教育出版社
[3] Sherif Sami El-dabi , Refat Ramsis and Alandin Kamel Arabic Character Recognition System: A Statistical Approach for Recognizing Cursive Typewriting Text   Pattern Recognition Vol 23 No 5 PP485-495 1990
[4] I. S. I Abuhaiba and P. Ahmed Restoration of Temporal Information offline Arebic Handwriting Pattern Recognition Vol 26 No 7 PP1009 - 1017 1993
[5] 边肇祺 模式识别 1993年 清华大学出版社
PDF(121 KB)

841

Accesses

0

Citation

Detail

段落导航
相关文章

/