本文通过对汉语自动分词难点的分析, 讨论了词频和词结合力的关系, 提出了一套机械切分与语义校正的汉语自动分词方法。系统包括建立绝对切分标志符表, 变长度最大匹配法、2一3一1优先规则集、固有歧义切分和组合歧义切分校正方法等。最后列举描述语义校正规则的实例。系统作为CETRAN.A的一部令, 在SUN8一280工作站上实现。
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]张潮生, 邻接约束与汉语计算机分词。中文信息处理国际会议论文集。Vol.2.pp.142一147.1987.8。
[2]梁南元, 刘源, 书面汉语计算机自动分词。中文信息(1),1986。
[3]管纪文, 谷新英, 结合上下文辅助分词的学习系统。中文信息处理国际研讨会论文集, 北京, 1983。
[4]姚天顺, 王宝库, 颜秀英, 《计算机的汉字信息处理》, 辽宁省科技出版社。1985.12.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}