基于知网的中文结构排歧工具——VXY

董 强,郝长伶,董振东

PDF(657 KB)
PDF(657 KB)
中文信息学报 ›› 2010, Vol. 24 ›› Issue (1) : 60-65.
综述

基于知网的中文结构排歧工具——VXY

  • 董 强,郝长伶,董振东
作者信息 +

A HowNet-Based Disambiguator for Chinese Syntactic Structures

  • DONG Qiang, HAO Changling, DONG Zhendong
Author information +
History +

摘要

该文介绍了基于知网的中文结构排歧工具系列中的一种 — VXY。VXY采取了一种独到的排歧技术,对于语言难点采取“定点清除”的策略。它用来解决“V+N+的+N”类型的结构性歧义。VXY是一个自足的、可以现场考核检验的并可以真正付诸实用的系统,而不是仅仅某种方法论的表演或举例性的“游戏”。该文简要地介绍了VXY的组成部分,说明了它的意义计算的原理。同时,该文就如何更有效地利用知网进行结构和语义排歧,如何开辟不同于当前语言信息处理中的“三部曲”(语料标注、现成的计算、应试性的评测)的语言技术等问题进行讨论。

Abstract

The paper introduces a HowNet-based disambiguator named VXY. The disambiguator effectively tackles the ambiguity in syntactic structures, e.g. “削(V)苹果(X)的 皮(Y)”, which appear highly-frequently in Chinese. The ambiguity of this kind lies in which word is governed by V in the structure, either X or Y. The HowNet-based disambiguator VXY is not merely a demonstration for the stereotypic methodology or algorithm, but a practical tool. for any structures composed by any one of the 98000 unique entries in HowNet Chinese vocabulary. Hence, the paper presents a paradigm completely different from the state-of the-art human language technology.
Key wordscomputer application; Chinese information processing; semantics; disambiguator; strong government; Chinese syntactic structure; HowNet

关键词

计算机应用 / 中文信息处理 / 语义 / 排歧工具 / 强支配 / 中文句法结构 / 知网

Key words

computer application / Chinese information processing / semantics / disambiguator / strong government / Chinese syntactic structure / HowNet

引用本文

导出引用
董 强,郝长伶,董振东. 基于知网的中文结构排歧工具——VXY. 中文信息学报. 2010, 24(1): 60-65
DONG Qiang, HAO Changling, DONG Zhendong. A HowNet-Based Disambiguator for Chinese Syntactic Structures. Journal of Chinese Information Processing. 2010, 24(1): 60-65

参考文献

[1] Zhendong Dong, Qian Dong, HowNet and the Computation of Meaning[M]. Singapore World Scientific, 2006.
[2] 冯志伟. 自然语言的计算机处理[M].上海:上海外语教育出版社,1996.
[3] 冯志伟.论歧义结构的潜在性[J].中文信息学报,1995,9(4):14-24.
[4] 苑春法,黄锦辉,等.基于语义知识的汉语句法结构排歧[J].中文信息学报,1999,13(1):1-8.
[5] 张克亮.基于HNC理论的句法结构歧义消解[J].中文信息学报,2004,18(6):43-52.
附录A
   1. 关于建议设立“汉语句典”课题的刍议V设立课题的刍议2. 难以打开局面的看法,的确反映了很多人的忧虑A打开局面的看法+反映很多人的忧虑3. 较为新颖的基于语料库的统计分析方法以外A基于语料库的方法4. 那是值得研究的问题V1值得研究的问题5. 少数人期待有关自然语言的“日心说”的出现N期待日心说的出现 (1)6. 目前研究自然语言处理的方法好比托勒密的理论N研究语言处理的方法7. 坚持这种扭曲的理论的结果是……。坚持理论的结果V8. 儿童学习自然语言的过程N学习自然语言的过程9. 要是我们把观察和思考问题的角度变换一下P思考问题的角度V10. 即采用适合计算机的特点的方法V适合计算机的特点 (1)11. 可以用一套形式语法系统来描述是这种方法的基石V是方法的基石 (1)12. 也是处理这种语言的切入点V1处理语言的切入点13. 支撑自然语言大厦的主要支柱可能不是支撑大厦的支柱V14. 我们仔细观察小孩子学说话的过程N学说话的过程15. 一个一个地掌握各种句模的用法Ad掌握句模的用法(1)16. 从而提高他们的说话和理解能力Ad提高他们的能力 (1)17. 尤其是在研究别人的言语Ad研究别人的言语 (1)18. 才打破了不能开口的局面Ad打破开口的局面(1)19. 我们也有教外国人的《汉语400句》了V教外国人的汉语400句20. 以上的说法并不是完全否认“语法”的作用Ad否认“语法”的作用(1)21. 旧句模的消亡过程受到全社会成员的参与N受到成员的参与(1)22. 《汉语400句》就是一个《1级汉语句典》的雏形N是句典的雏形(1)23. 类似于人类自己掌握自然语言的过程N掌握自然语言的过程24. 容易考核工作的实际进展A考核工作的进展(1)25. 容易判断自己工作的质量A判断工作的质量(1)26. 我提出上述建立《句典》的建议N建立句典的建议27. 任一语句是否属于本句型的算法N属于句型的算法(1)28. 而这个课题所要解决的是面向计算机的句典V1面向计算机的句典29. 根本无法纳入我们心目中的《句典》中Aux纳入心目中的句典(1)30. 以上是个人的浅见A是个人的浅见(1)               
PDF(657 KB)

750

Accesses

0

Citation

Detail

段落导航
相关文章

/