规则和统计相结合的汉语词类标注方法

周强

PDF(616 KB)
PDF(616 KB)
中文信息学报 ›› 1995, Vol. 9 ›› Issue (3) : 1-10.

规则和统计相结合的汉语词类标注方法

  • 周强
作者信息 +
History +

摘要

本文分析了汉语的多类词现象与汉语词类标注的困难, 介绍了汉语词类标注中的规则排歧和统计排歧的处理策略以及规则和统计相结合的处理思路。按此思路设计的软件系统, 对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。

引用本文

导出引用
周强. 规则和统计相结合的汉语词类标注方法. 中文信息学报. 1995, 9(3): 1-10

参考文献

[1]Church,K.1988."A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text",Second Conference on Applied Natural Language Processing(ACL) 136-143.
[2]Derose,J.Steven.1988."Grammatical Category Disambiguation by statistical Optimization", Computational Linguistics,Vol 14, 31-39.
[3]Greene,Barara B. and Rubin,Gerald M. 1971.Automated Grammatical Tagging of English. Brown University.
[4]Hindle,D.1989."Acquiring Disambiguation Rules from Text" ACI,118-125.
[5]Kucera,H. and Francis, W. Nelson, 1982. Frozency Analysis of English Usage:Lexicon and Grammar Hougnton-Mifflin Company,Boston.
[6]Marshall,Jan.1983."Choice of Grammatical Word-Class Without Global Synactic Analysis", Computer in the Humanities 17:139-150.
[7]Shannon, C. 1948. "The mathematical theory of communication", Bell System Technical Journal,27,398-403.
[8]白栓虎、夏莹、黄昌宁, 1992, “汉语语料库词性标注方法研究”, 机器翻译研究进展,408-418.
[9]刘开瑛、郑家恒、赵军, 1992, “语料库词类自动标注算法研究”, 机器翻译研究进展, 378-386.
[10]孟琮, 郑怀德, 孟庆海, 蔡文兰编, 1985, 动词用法词典, 上海辞书出版社.
[11]俞士汶, 1993, “关于现代汉语词语的语法功能分类”, 中国计算机报,1994.5.31,第37版
[12]俞士汶, 姜新, 朱学锋, 侯方, 1991, “机器翻译译文质量自动评估系统”, 中国中文信息学会十周年论文集, 314-319.
[13]郑怀德, 孟庆海编, 1991, 形容词用法词典, 湖南出版社
[14]周强, 俞士汶, 1993, “一种切词和词性标注相融合的汉语语料库多级加工方法”, 计算机研究与运用, 北京语言学院出版社
[15]朱德熙, 1985, 《语法答问》, 商务印书馆
PDF(616 KB)

592

Accesses

0

Citation

Detail

段落导航
相关文章

/