引用本文:
张克亮. 基于HNC理论的句法结构歧义消解[J]. 中文信息学报, 2004, 18(6): 44-53.
ZHANG Ke-liang. An HNC Approach to the Resolution of Syntactic Structural Ambiguity. , 2004, 18(6): 44-53.
基于HNC理论的句法结构歧义消解
张克亮1,2
1.中科院声学所 2.解放军外国语学院
An HNC Approach to the Resolution of Syntactic Structural Ambiguity
ZHANG Ke-liang1,2
1.Institute of Acoustics , CAS 2.PLA University of Foreign Languages
摘要 歧义消解是自然语言理解和处理所面对的核心问题。基于词组和短语的消歧不能保证消歧结果的正确,歧义的成功消解基于对语境或上下文(context)的正确理解。HNC理论采取的概念基元化、层次化、网络化、形式化策略以及在此基础上建立的句类和句式体系,为自然语言的歧义消解提供了最大的可能。基于HNC理论的歧义消解的总体原则是,以语句为基础,充分利用语句语境提供的句类知识,采取宏观消歧与微观消歧相结合的策略。对于经典句法歧义结构V+NP1+的+NP2,本文描述了其三重性歧义性质,并提出了三条准则和十个推论以实现对其歧义的消解。
关键词 :
人工智能 ,
自然语言处理 ,
HNC理论 ,
句法结构歧义 ,
V+NP1+的+NP2 ,
消解策略 ,
消解准则
Abstract :Disambiguation has always been the focus of natural language understanding and processing. Successful disambiguation relies on the correct understanding of a given context. The HNC theory is characteristic of its formalized representation of conceptual primitives , its arrangement of concepts in a hierarchical network , and its development of the sentence category (SC) and sentence format (SF) systems. All this provides the utmost possibility for resolving ambiguity in natural languages. The overall principle for HNC-based disambiguation is to take sentence as the basis for disambiguation and to integrate micro disambiguation into macro disambiguation. In the case of V + NP1 + 的+ NP2 , a triple ambiguous syntactic structure in the HNC perspective , proper rules are suggested for its disambiguation.
Key words :
artificial intelligence
natural language processing
HNC theory
syntactic structural ambiguity
V + NP1 + 的 + NP2
disambiguation strategies
disambiguation rules
收稿日期: 2004-03-22
基金资助: 国家重点基础研究发展规划资助项目(G1998030506);中科院声学所所长择优基金资助项目(S13SJJ01)
作者简介 : 张克亮(1964 —),男,博士,副教授,主要研究方向为语言学、计算语言学及机器翻译.
[1] 冯国华. 语境通观, 随便适会 - 在具体语境中把握词义[J] . 中国翻译, 2003 , (1) :76 - 81. [2 ] 冯志伟. 自然语言的计算机处理[M] . 上海: 上海外语教育出版社, 1996. [3] 戈玲玲. 语境关系顺应论对词义选择的制约[J] . 中国科技翻译, 2001 , (4) :27 - 30. [4] HNC概念符号体系[EB/OL] . http://www.hncnlp.com. [5] 黄曾阳. HNC(概念层次网络)理论 - 计算机理解语言研究的新思路[M] . 北京: 清华大学出版社, 1998. [6] 黄曾阳. 句类分析的二十项难点[EB/OL] . http://www.hncnlp.com , 2000. [7] 黄曾阳. 反思与碰撞[A] . 第二届NNC与语言学研究学术研讨会论文集[C] . 2003 年9月20~22日, 北京. [8] 晋耀红. 基于语义的文本过滤系统的设计与实现[J] . 计算机工程与应用,2003 , (17) :22 - 25. [9] 苗传江. HNC句类知识研究[D] . 中科院声学所博士学位论文, 2001. [10] 盛晓明. 话语规则与知识基础 - 语用学维度[M] . 上海: 学林出版社, 2000. [11] 王建华. 关于语境的构成与分类[J] . 语言文字应用, 2003 (3) :2 - 9. [12] 王永生, 柴佩琪, 卫蔚. 德汉机器翻译中的语义消岐策略[J] . 中文信息学报,1998 ,12 (2) :54 - 62. [13] 维特根斯坦. 哲学研究[M] , 李步楼译. 北京: 商务印书馆, 2002. [14] 涂纪亮. 西方语言哲学研究的现状和前景[J] . 外语教学与研究, 2003 , (5) :323 - 330. [15] 许嘉璐. 现状和设想——试论中文信息处理与现代汉语研究[J] . 中国语文,2000 , (6) :490 - 496. [16] 杨晓峰, 李堂秋, 洪青阳. 基于实例的汉语句法结构歧义消解[J] . 中文信息学报,2001 ,15 (3) :22 - 28. [17] 张克亮. HNC语句格式表示[A] . 张全、萧国政主编:HNC与语言学研究[C] . 武汉: 武汉理工大学出版社, 2001 :191 - 195. [18] 张克亮, 黄曾阳. HNC作用效应句的汉英句类转换[J] . 中文信息学报,2003 ,17 (5) :19 - 26.
[1]
李 斌;闻 媛;卜丽君;曲维光;薛念文. 英汉《小王子》抽象语义图结构的对比分析 [J]. 中文信息学报, 2017, 31(1): 50-57.
[2]
张 义,李治江. 基于高斯词长特征的中文分词方法 [J]. 中文信息学报, 2016, 30(5): 89-93.
[3]
王超超,熊德意. 计算语义合成性综述 [J]. 中文信息学报, 2016, 30(3): 1-8.
[4]
褚晓敏,王中卿,朱巧明,周国栋. 基于简介和评论的标签推荐方法研究 [J]. 中文信息学报, 2015, 29(6): 179-184.
[5]
李 强,袁毓林. 名词词义描写和研究需要什么样的语义学知识? [J]. 中文信息学报, 2015, 29(5): 9-20.
[6]
宋亚军,于中华,陈 黎,丁革建,罗 谦. 一种改进的社交媒体文本规范化方法 [J]. 中文信息学报, 2015, 29(5): 104-112.
[7]
邹博伟,周国栋,朱巧明. 否定与不确定信息抽取研究综述 [J]. 中文信息学报, 2015, 29(4): 16-24.
[8]
王 倩,罗森林,韩 磊,潘丽敏. 基于谓词及句义类型块的汉语句义类型识别 [J]. 中文信息学报, 2014, 28(2): 8-16.
[9]
刘盈盈,罗森林,冯 扬,韩 磊,陈 功,王 倩. BFS-CTC汉语句义结构标注语料库 [J]. 中文信息学报, 2013, 27(1): 72-81.
[10]
段 楠1,李 沐2,周 明1, 2. 统计机器翻译中一致性解码方法比较分析 [J]. 中文信息学报, 2013, 27(1): 64-72.
[11]
岳大鹏1,饶 岚2,王 挺1. 一种针对新闻话题的多文档文摘技术 [J]. 中文信息学报, 2012, 26(6): 79-85.
[12]
于屏方1,2,杜家利3,4. 良构子串表在自然语言处理中的程序化应用以花园幽径句为例 [J]. 中文信息学报, 2012, 26(5): 107-114.
[13]
张颖杰1,李 斌1,2,陈家骏1,陈小荷2. 基于词典信息的先秦汉语全文词义标注方法研究 [J]. 中文信息学报, 2012, 26(3): 65-72.
[14]
王青海1,马海慧1,2,池毓焕3,李 颖1,董凌冲4. 基于HNC的汉语词语知识库改进 [J]. 中文信息学报, 2012, 26(2): 35-40.
[15]
俞士汶,穗志方,朱学锋. 综合型语言知识库及其前景 [J]. 中文信息学报, 2011, 25(6): 12-21.