识别多种印刷体汉字的TTWK法

方应谦,李明禄,林欣,邹敏华

PDF(375 KB)
PDF(375 KB)
中文信息学报 ›› 1987, Vol. 1 ›› Issue (3) : 22-27.
综述

识别多种印刷体汉字的TTWK法

  • 方应谦,李明禄,林欣,邹敏华
作者信息 +
History +

摘要

本文提出了“ 脱壳透视” 的分类原理, 该分类原理对同一汉字集上不同字体的汉字的分类一致性较好, 抗干扰能力强, 是多种印刷体汉字自动识别中较为满意的分类方法。在识别特征的选取上, 我们提出了“ 特征稳定度” 概念, 从这个概念出发, 提取了每个汉字的稳定识别特征和同字异体的公共识别特征, 将每个汉字的复杂结构抽象成一个具有典型特征的框架模型(简称“ 稳定框架原理” )有效地提高了识别率, 压缩了存储空间。根据这些原理, 我们以OKIFAX7700传真机作扫描器, 在CROMEMCO SYSTEM THREE上实现了对GB2312一级字3755个四号宋体及黑体汉字98.57%的识别率及3.24字/秒的识别速度。

引用本文

导出引用
方应谦,李明禄,林欣,邹敏华. 识别多种印刷体汉字的TTWK法. 中文信息学报. 1987, 1(3): 22-27
PDF(375 KB)

475

Accesses

0

Citation

Detail

段落导航
相关文章

/