摘要
日本和印度几西亚、泰国、中国、马来西亚正在合作开发多国语言机器翻译系统。本文介绍这个项目中的正在研究开发的汉语询典开发辅助系统的词典信息推断功能。
这个项目从1987年开始, 计划用6年时问, 采用中间语言方式, 实现5国语言间的互相翻译, 打算利用本词典开发辅助来统进行编制的汉语词典, 将主要用于这个项目中的汉语分析、汉语生成以及中文输入。
本汉语词典开发辅助系统, 以大量语料为基础, 收集单词, 推断能从例句导出的词典信息, 还可以检验人工完成的词典记述并补充词典信息。本文叙述了从分析大量语料入手, 在提取词典中尚未登录的单词(形态素)的同时, 建立KWIC(上下文中关键词)索引, 并以这种大规模的KWIC为基础, 根据源于连接关系的束缚条件推断语法特征尚不清楚的汉语单词的语法属性的方法
朱美英1,内田裕士1,俞士汶2.
基于连接关系的汉语词典信息的推断. 中文信息学报. 1991, 5(2): 52-60
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]内田裕士, 杉山健司:自由输入形式假名汉字变换, 自然语言处理研究会资料, 27-3(1981)
[2]朱美英, 内田裕士:多种语言翻译用汉语辞典, 自然语言处理研究会资料, 71-6(1989)
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}