中文信息学报
       ISSN 1003-0077   CN 11-2325/N   CODEN ZXXHAU 设为首页        加入收藏
   RSS  Email Alert     
   
 
引用检索 快速检索 高级检索
 
1991年 5卷 4期
刊出日期:1991-08-15

 
   
3 题词
钱为长 ,陈力为
1991 Vol. 5 (4): 3-3 [摘要] ( 185 ) [HTML 1KB] [PDF 46KB] ( 540 )
4 纪念《中文信息学报》创刊五周年
本刊编辑部
中国中文信息学会主办的全国性学术创刊物——《中文信息学报》创刊已整整五年了,它是随着中文信息处理事业的发展而成长起来的。五年来, 在广大作者、读者的关心和支持下, 刊登论文内容日益丰富、全面, 水平逐步提高。学报不仅为我国从事这一领域及相关领域的科研工作者提供了学术交流园地, 同时, 对振兴和发展我国中文信息处理技术, 开展国际学术交流活动, 促进我国国民经济建设也作出了应有的贡献。
1991 Vol. 5 (4): 4-4 [摘要] ( 179 ) [HTML 1KB] [PDF 87KB] ( 303 )
5 机器翻译系统中一种规则描述语言(CTRDL)
王宝库,张中义,姚天顺
本文的目的在于为汉英机器翻译系统(CETRA)提供一种处理中文文本的规则描述语言(CTRDL)。这是一种受限的语言, 用以定义中文文本的分析和生成文法。实际上任何特定语言的文法都可用这种元语言的形式系统加以描述。
1991 Vol. 5 (4): 5-16 [摘要] ( 155 ) [HTML 1KB] [PDF 631KB] ( 939 )
17 汉字键盘输入的认知模型
张侃1,陈一凡2
本文从汉字键盘输入方法评测的重要意义和目前遇到的困难出发, 说明以工程心理学的方法建立的汉字键盘输入认知模型是设计完整的评测系统和优化输入方案的有效手段。
1991 Vol. 5 (4): 17-23 [摘要] ( 214 ) [HTML 1KB] [PDF 384KB] ( 945 )
24 实现汉字简繁体自动转换的一种方法
杜宇,何克抗
本文提出并实现了一种利用上下文构词关系进行汉字简繁体自动转换的方法。与现有其他转换方法相比, 可以有效地解决“多义对应”问题并可显著提高转换速率。
1991 Vol. 5 (4): 24-30 [摘要] ( 199 ) [HTML 1KB] [PDF 461KB] ( 964 )
31 汉语自动分词实用系统CASS的设计和实现
揭春雨1,刘源2,梁南元2
近年来, 汉语自动分词成力中文信息处理的一大热门课题, 其研究进展令人关注。本文主旨, 是通过介绍CASS系统的设计和实现, 阐述汉语自动分词实用系统的一般性原理, 包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理, 等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现, 该算法的嵌套调用, 可以识别出各种多义切分字段, 包括任意多重的交集型多义字段。这个算法经过相应的运行控制, 可以实现其它各种分词方法。
1991 Vol. 5 (4): 31-38 [摘要] ( 252 ) [HTML 1KB] [PDF 516KB] ( 791 )
39 汉字假名变换技术及其应用
朱学锋,俞士汶
本文详细分析了将日语汉字变换为假名的困难及现实可能性。笔者开发了一种汉字假名变换技术, 并将其应用于英日汉对照的计算语言学词典的开发。本文对应用结呆进行了分析。本文还探讨了这项技术的潜在应用领域。
1991 Vol. 5 (4): 39-46 [摘要] ( 178 ) [HTML 1KB] [PDF 326KB] ( 962 )
47 关系数据库汉语查询接口的设计与实现
吕光楣,陈清波
汉语接口一直是我国AI界研究的热门课题之一。本文首先对汉语接口的可行性进行了论证, 然后在分析了自然查询语言功能特征的基础上, 提出了以词汇为基础, 以语义特征为先导的综合处理技术。为使接口能进行移植, 又引入了数据库模式字典, 设置移植和学习模块, 使之重建专用字典, 与新库连接。最后给出了实验系统的结构和流程图, 并作出该系统的性能评价和测试结果。
1991 Vol. 5 (4): 47-53 [摘要] ( 167 ) [HTML 1KB] [PDF 482KB] ( 1035 )
54 一个手写印刷体汉字识别实验系统
陈玲1,陈学德1,郑重1,青木由直2
本文在充分考察了手写汉字和中国大汉字集特点的基础上, 提出了一组用于手写印刷体汉字识利的分类特征, 它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312-80汉字集中的绝大部分汉字, 再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字, 这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计, 它是SLSA方法的改进, 与机器学习功能相配合, 大大提高了特征抽取的正确率。我们根据上述思想建立了一个手写印刷体汉字识别实验系统, 并获得了较好的实验结果。
1991 Vol. 5 (4): 54-59 [摘要] ( 193 ) [HTML 1KB] [PDF 372KB] ( 815 )
60 编码字符集中子集的完整性
许寿椿
本文提出编码字符集中的完整性问题。(一)中给出两类编码实例。一类严格遵从“一个字符只分配给一个码位”或“任何字符都不重复分配码位”( 简称一符一码)的节约原则。另一类以一符两码可多码的方式, 以码位的牺牲换取子集的完整性。(二)中解释了子集完整性概念和意义。说明了有意义的子集通常是现实中某子系统的反映。多文种编码字符集的许多子集往往与某自然语言系统相关联,这种子集的完整性, 也就与相应语言文字的系统性相关联。据此提出了完整性条件, 此较了完整性得失, 说明了完整性的某种相对性。(三)中指出不少字符集, 含ISO 10646 DP版及DIS版, 的一符一码原则损害了若干子集的完整性。在那里,拉丁文字圈中除英文以外的各国家、各民族的文字字符子集大多被肢解了, 只有字母表是英文字母表(含元素2X26=52个)子集者例外。斯拉夫文字圈、阿拉伯文字圈情况相似。文中指出汉语拼音字母子集, 无论在汉字编码的中国国家标准中还是国际标准10646中放严重肢解了。 本文是作者另文《字符集的序性》〔9〕的续编。本文的讨论仍除外汉文及藏文
1991 Vol. 5 (4): 60-66 [摘要] ( 179 ) [HTML 1KB] [PDF 474KB] ( 793 )
中文信息学报
·编辑部2022年春节放假通知
·2022年期刊订阅
更多....  
更多....  
更多....  
中国知网
万方数据
更多....  
 
版权所有 © 《中文信息学报》编辑部    
地址:北京市海淀区中关村南四街4号 邮编:100190 电话:010-62562916 E-mail:cips@iscas.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发