引用本文:
张纯 , 张涛 , 黄笑. 中文商务名片识别系统的实现[J]. 中文信息学报, 2000, 14(2): 21-25.
Zhang Chun , Zhang Tao , Huang Xiao. A Chinese Business Cards Recognition System. , 2000, 14(2): 21-25.
中文商务名片识别系统的实现
张纯 , 张涛 , 黄笑
中国科学院自动化研究所文字识别工程中心
A Chinese Business Cards Recognition System
Zhang Chun , Zhang Tao , Huang Xiao
Institute of Automation , CAS
摘要 本文介绍了一个实际应用中的中文商务名片识别系统,分析了系统的结构。该系统首先结合实际中的一些具体问题对名片图象进行预处理,然后在传统版面分析技术的基础上针对名片版面的特点进行版面分析。在对分割区域的字符进行识别之后,根据识别结果中的语义知识和版面分析得到的位置信息对识别结果进行基于知识规则的理解,从而实现了名片信息的自动录入,整个系统在实际中表现出了良好的性能。
关键词 :
名片识别系统 ,
图象处理 ,
版面分析 ,
字符识别 ,
基于知识规则的理解
Abstract :In this paper ,we propose a Chinese business cards recognition system ,and analyze the structure of it . The first part of the system is the pretreatment of business card image. In this part ,we have to solve many practical problems. Then ,the system analyze the layout of the business card , divide it into several blocks. In follow ,the characters in every block are recognized ,and the result is further understood by using knowledge rules. After whole process ,the information of business card is imported to the computer automatically.
Key words :
Chinese business cards recognition system
Image manipulation
Layout Analysis
Character recognition
Knowledge rule
[1] Yaw - Huei Chiou ,Hsi-Jian Lee. Recognition of Chinese Business Cards. In : Proc of 4rd ICDAR , Germany ,1997 [2] 林晓帆,丁晓青,吴佑寿. 名片自动录入系统的实现. 数据采集与处理,1998 ,6 [3] 吴晋华. 高性能中文印刷体文本识别研究[硕士学位论文] . 北京:中国科学院自动化研究所,1994 [4] Guo H ,Ding X Q ,Guo F X. Realization of a high-performance billingual Chinese-English OCR system. In :Proc of 3rd ICDAR ,Canada ,1995 ,978 - 981 [5] Toriu Takashi , Iwase Hiromichi ,Gotoh. Method for threshold selection using minimum filtering. Toshiyuki. In :Systems and Computers in Japan ,1990 ,21 (12) :16 - 24 [6] 姜哲,夏莹. 中文版面分析技术. 见:第六届全国汉字识别学术会议论文集,重庆,1996 [7] 徐建华. 图象处理与分析. 北京:科学出版社,1992
[1]
郭育生,谭怒涛,黄磊,刘昌平. 一种中文文档的数学公式定位方法 [J]. 中文信息学报, 2008, 22(4): 83-87.
[2]
马瑞,杨静宇. 基于高阶统计的手写字符形变弹性匹配法 [J]. 中文信息学报, 2006, 20(5): 67-72.
[3]
赵巍,李春娣,刘家锋,唐降龙. 面向连续字符识别的手写汉字部件集及统计规律 [J]. 中文信息学报, 2006, 20(5): 60-66.
[4]
许日俊,刘昌平. 印刷体朝鲜文字符中字母的分割与识别研究 [J]. 中文信息学报, 2006, 20(2): 68-73.
[5]
靳简明,丁晓青,彭良瑞,王华. 印刷维吾尔文本切割 [J]. 中文信息学报, 2005, 19(5): 78-85.
[6]
欧文武,朱军民,刘昌平. 自然场景文本定位 [J]. 中文信息学报, 2004, 18(5): 43-48,64.
[7]
王华,丁晓青. 多字体印刷藏文字符识别 [J]. 中文信息学报, 2003, 17(6): 48-53.
[8]
刘飞,罗予频,胡东成. 基于数学形态学的自适应文字版面分析方法 [J]. 中文信息学报, 2002, 16(2): 54-59.
[9]
刘定强 , 张炘中. 基于组件的中文版面分析 [J]. 中文信息学报, 2000, 14(2): 8-13.
[10]
姜哲 , 马少平 , 夏莹. 大型中文古籍《四库全书》自动版面分析系统 [J]. 中文信息学报, 2000, 14(2): 14-20.
[11]
薛炳如,杨静宇,娄震,胡钟山. 小类别数手写汉字建模 [J]. 中文信息学报, 1999, 13(6): 35-41.
[12]
田学东,郭宝兰. 基于组合特征的中文版面分析方法 [J]. 中文信息学报, 1999, 13(4): 23-29.
[13]
樊丽萍,陈健美,邹荣金. 字符点相关技术与神经网络识别 [J]. 中文信息学报, 1999, 13(4): 42-49.
[14]
卢达1,谢铭培2,钱忆平1,浦炜1. 一种基于骨架法形态分析的粘连字符图象分切方法 [J]. 中文信息学报, 1999, 13(2): 41-46.
[15]
赵斌1,苏辉2,夏绍玮1. 一种无约束手写体数字串分割方法 [J]. 中文信息学报, 1998, 12(3): 22-29.