词链现象是书面汉语自动分词的困难所在, 本文针对词链现象的复杂性, 提出了一种“生成—测试”分词法。这种方法以知识为基袖, 它通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现了词链的有效切分和汉语句子切分与理解(生成格结构)的并行。“生成—测试”方法反映了人的分词和理解过程。
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]黄祥喜, 汉语词链的可切分性问题, 《中文信息处理标准化国际研讨会· 北京·89-03-21/24》(待发表)
[2]黄祥喜, 书面汉语自动分词现状和间题, 《情报学报》(待发表)
[3]管纪文等, 结合上下文辅助分词的学习系统, 《中文信息处理国际研讨会论文集》(第2卷),(1983) , 11-18
[4]Woods, W.A.,Transition Network Grammars for Natural Language Analysis, Communication of ACM, 13:10(1970),591-606
[5]黄祥喜, 书面汉语的计算机分词和理解,吉林大学博士论文, 1989年3月
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}