藏文自动分词系统的设计与实现

陈玉忠,李保利,俞士汶

PDF(329 KB)
PDF(329 KB)
中文信息学报 ›› 2003, Vol. 17 ›› Issue (3) : 16-21,66.

藏文自动分词系统的设计与实现

  • 陈玉忠,李保利,俞士汶
作者信息 +

The Design and Implementation of a Tibetan Word Segmentation System

  • CHEN Yu-zhong,LI Bao-li,YU Shi-wen
Author information +
History +

摘要

藏文自动分词系统的研制目前在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现过程,内容包括系统结构、分词知识库的组织与实现以及分词策略、算法设计及其详细的自动分词过程实例。文章最后给出了实验结果,结果表明系统具有较高的切分精度和较好的通用性。

Abstract

Word segmentation for Tibetan has not been well studied yet . This paper reports a Tibetan word segmentation system that we designed and implemented. Several issues about the system are explained , which include system architecture , knowledge bases , segmentation strategy , and algorithms. In preliminary experiments , the system demonstrates higher accuracy and domain independency.

关键词

计算机应用 / 中文信息处理 / 格助词 / 接续特征 / 藏文 / 自动分词

Key words

computer application / Chinese information processing / case-auxiliary word / continuous feature / tibetan word segmentation

引用本文

导出引用
陈玉忠,李保利,俞士汶. 藏文自动分词系统的设计与实现. 中文信息学报. 2003, 17(3): 16-21,66
CHEN Yu-zhong,LI Bao-li,YU Shi-wen. The Design and Implementation of a Tibetan Word Segmentation System. Journal of Chinese Information Processing. 2003, 17(3): 16-21,66

参考文献

[1] 陈玉忠,李保利,俞士汶,兰措吉. 基于格助词和接续特征的书面藏文分词方案. 语言文字应用,2003 (1) .
[2] 才旦夏茸,藏文文法详解,西宁:青海民族出版社,1988.
[3] 朱德熙. 语法讲义. 北京:商务印书馆,1999.
[4] 刘挺,吴岩,王开铸. 串频统计和词形匹配相结合的汉语自动分词系统. 中文信息学报,1998 (1) .
[5] 陈小荷. 自动分词中未登录词问题的一揽子解决方案. 语言文字应用,1999 (3) .

基金

国家自然科学基金资助项目(69663001);973资助项目(G1998030507-4)
PDF(329 KB)

1148

Accesses

0

Citation

Detail

段落导航
相关文章

/