|
|
引用本文: |
揭春雨1,刘源2,梁南元2. 汉语自动分词实用系统CASS的设计和实现[J]. 中文信息学报, 1991, 5(4): 31-38.
|
|
汉语自动分词实用系统CASS的设计和实现 |
揭春雨,刘源,梁南元 |
1.香港城市理工学院 2.北京航空航天大学 |
|
|
摘要 近年来, 汉语自动分词成力中文信息处理的一大热门课题, 其研究进展令人关注。本文主旨, 是通过介绍CASS系统的设计和实现, 阐述汉语自动分词实用系统的一般性原理, 包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理, 等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现, 该算法的嵌套调用, 可以识别出各种多义切分字段, 包括任意多重的交集型多义字段。这个算法经过相应的运行控制, 可以实现其它各种分词方法。
|
|
|
[1]刘源, 梁南元:“OM自动分词方法”,《中文信息》, 1985年第3期。 [2]刘源, 梁南元:“汉语处理的基础工程——现代汉语词频统计”,《中文信息学报》,1986年第1期。 [3]梁南元, 刘源:“书面汉语计算机自动分词”, 《中文信息》, 1986年第1期。 [4]梁南元:“汉语自动分词系统——CDWS”,《中文信息学报》, 1987年第2期。 [5]梁南元:“书面汉语自动分词综述”, 《计算机应用和软件》, 1987年第3期。 [6]管纪文, 谷新英:“结合上下文辅助分词的学习系统”, 《中文信息处理国际研讨会论文集, 1983年10月, 北京。 [7]王锡龙:“分词词典与知识库系统”, 中文信息研究会第二次学术会议论文, 1983年5月。 [8]揭春雨, 刘源, 梁南元:“论汉语自动分词方法”, 首届全国计算语言学学术会议论文,1988年6月, 北京,清华大学, 《中文信息学报》1989年第1期。 [9]Jie Chunyu, A Systematic Strcture Model For Methods of Chinese Atomatic Word Segmentation and Their Evaluation, Proceedings of Chinese Computing Conference 89, Sept., 1989, Sigapore. |
[1] |
李丽双;蒋振超;万 佳;黄德根. 利用词表示和深层神经网络抽取蛋白质关系[J]. 中文信息学报, 2017, 31(1): 31-40. |
[2] |
谢 珺;郝 洁;苏婧琼;邹雪君;李思宇. 一种针对短文本的主题情感混合模型[J]. 中文信息学报, 2017, 31(1): 162-168. |
[3] |
玛尔哈巴·艾赛提;艾孜尔古丽;玉素甫·艾白都拉. 基于语法的维吾尔语情感词汇自动获取[J]. 中文信息学报, 2017, 31(1): 126-132. |
[4] |
胡韧奋. 汉语词汇测试自动命题研究[J]. 中文信息学报, 2017, 31(1): 41-49. |
[5] |
张 栋;李寿山;王晶晶. 基于问题与答案联合表示学习的半监督问题分类方法[J]. 中文信息学报, 2017, 31(1): 1-7. |
[6] |
于 东;赵 艳;韦林煊;荀恩东;. 基于点关联测度矩阵分解的中英跨语言词嵌入方法[J]. 中文信息学报, 2017, 31(1): 58-65. |
[7] |
白双成;. 蒙古文原始语料统计建模研究[J]. 中文信息学报, 2017, 31(1): 118-125. |
[8] |
谭红叶; 赵红红; 李 茹;. 面向阅读理解复杂问题的句子融合[J]. 中文信息学报, 2017, 31(1): 8-16. |
[9] |
叶 雷;高盛祥;余正涛;秦广顺;洪旭东. 基于事件元素无向图的查询扩展方法[J]. 中文信息学报, 2017, 31(1): 17-22. |
[10] |
李 斌;闻 媛;卜丽君;曲维光;薛念文. 英汉《小王子》抽象语义图结构的对比分析[J]. 中文信息学报, 2017, 31(1): 50-57. |
[11] |
孙 媛;赵 倩;. 藏汉跨语言话题模型构建及对齐方法研究[J]. 中文信息学报, 2017, 31(1): 102-111. |
[12] |
孙世昶;林鸿飞;孟佳娜;刘洪波. 利用源域结构的粒迁移学习及词性标注应用[J]. 中文信息学报, 2017, 31(1): 66-74. |
[13] |
康司辰;刘 扬;. 基于语义构词的汉语词语语义相似度计算[J]. 中文信息学报, 2017, 31(1): 94-101. |
[14] |
陈振宁;陈振宇. 基于偏向相似性的自然语言关联和聚类研究[J]. 中文信息学报, 2017, 31(1): 205-211. |
[15] |
阿力木·木拉提;艾孜尔古丽;杨雅婷;李 晓;. 基于多策略的维吾尔文网页识别方法[J]. 中文信息学报, 2017, 31(1): 133-139. |
|
|
|
|