抽取一个句子的核心依存图是对句子进行语义理解的有效途径。在CFN自动标注的基础上,只能得到框架依存图,为了把框架依存图转换成框架核心依存图需要提取每个框架元素的语义核心词。该文提出了基于多词块标注的框架元素语义核心词识别和提取方法,通过对比分析,给出了多词块和框架元素的融合策略,并建立了在多词块标注基础上提取框架元素语义核心词的规则集。在6 771个框架元素上的实验结果显示,采用该文的方法和规则集提取框架元素核心词的平均准确率和覆盖率分别为95.58%和82.91%。
Abstract
It is an effective way to understand the semantic information of a sentence by extracting the frame kernel dependency graph from the sentence. It is necessary to extract semantic core words for each frame element to further establish the frame kernel dependency graph since we can only extract the frame dependency graph from a sentence based on the automatic annotation of CFN, This paper proposes a method to identify and extract the core words of frame elements by multi-word chunk. On the basis of comparative analyzing results, we propose the strategy of integrating the multi-word chunk and frame element and the rules to extract the core words of frame elements from the multi-word chunk labeling. The experimental results from 6 771 frame elements show that the average precision and average coverage are 95.58% and 82.91%, respectively.
Key wordscomputer application; Chinese information processing; Frame element;Semantic core words;Multi-word chunk
关键词
计算机应用 /
中文信息处理 /
框架元素 /
语义核心词 /
多词块
{{custom_keyword}} /
Key words
computer application /
Chinese information processing /
Frame element /
Semantic core words /
Multi-word chunk
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 吴云芳. 并列成分中心语语义相似性考察[J]. 当代语言学, 2005, 7(4): 305-315.
[2] 周强, 俞士汶. 汉语短语标注标记集的确定[J]. 中文信息学报, 1996, 10(4): 1-11.
[3] 赵军, 黄昌宁. 汉语基本名词短语结构分析模型[J]. 计算机学报, 1999, 22(2): 141-146.
[4] 张昱琪, 周强. 汉语基本短语的自动识别[J]. 中文信息学报,2002,16(6): 1-8.
[5] 赵军, 黄昌宁. 基于转换的汉语基本名词短语识别模型[J]. 中文信息学报, 1998, 12(2): 1- 8.
[6] 周雅倩, 郭以昆, 黄萱菁, 吴立德. 基于最大熵方法的中英文基本名词短语识别[J]. 计算机研究与发展, 2003, 40(3): 440-446.
[7] 干俊伟, 黄德根. 汉语介词短语的自动识别[J]. 中文信息学报, 2005, 19(4): 17-23.
[8] 郝晓燕, 刘伟, 李茹, 刘开瑛. 汉语框架语义知识库及软件描述体系[J]. 中文信息学报, 2007, 21(5): 96-100.
[9] Charles J. Fillmore, Josef Ruppenhofer, Collin F. 框架网络与语义、句法联系的表征[M].俞士汶, 黄居仁. 计算语言学前瞻. 北京: 商务印书馆,2005: 21-74.
[10] Carl Pollard and Ivan A. Sag. Head-Driven Phrase Structure Grammar[M]. Chicago: University of Chicago Press, 1994.
[11] 周强. 汉语基本块描述体系[J]. 中文信息学报, 2007, 21(3): 21-27.
[12] 刘海涛. 依存语法和机器翻译[J]. 语言文字应用,1997, 3: 89-93.
[13] 周强,赵颖泽. 汉语功能块自动分析[J]. 中文信息学报, 2007, 21(5): 18-24.
[14] 党政法, 周强. 短语树到依存树的自动转换研究[J]. 中文信息学报, 2005, 19(3): 21-27.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
国家自然科学基金资助项目(60970053);国家863高技术研究发展计划资助项目(2006AA01Z142), 山西省实验室开放基金资助项目(2009011059-4);国家大学生创新性实验计划项目(081010816)
{{custom_fund}}