汉语的书面语是按句连写的, 词间无间隙。因此在汉语书面语的处理中, 例如, 统计、分析、理解等, 我们首先遇到的问题是词的切分。把按句连写转换为按词连写, 所以, 词的正确切分是进行汉语书面语处理的必要条件它的任何错误都将使处理结果受到或大或小的影响, 有时是严重的影响。
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1]陈力为,'Some Key Issues in Chinese Language Information Processing and Their Prospective Developments' 1987 ICCIP Conference,Beijing
[2]陈力为, ’当前中文信息处理中的几个问题及其发展前景'计算机世界, 1987年, 第21期, 第34版
[3]周锡令,‘软件书籍中译本的可读性和几点建议'计算机世界, 1995年, 第41期, 第15版
[4]梁南元, 再论汉语自动分词和切分知识,1987 ICCIP Conference,Beijing
[5]郑家恒, 刘开瑛, 自动分词系统中姓氏人名处理策略探讨 计算语言学研究与应用1993
[6]宋柔等, 基于语料库和规则库的人名识别法 计算语言学研究与应用,1993.
[7]沈达阳等, ‘中国地名的自动辨识 计算语言学进展与应用,1995
[8]许嘉璐, 在香山科学会议第次会议的发言 1995年10月31日
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}