基于本体和依存句法的词汇语义关系标注及评价方法研究

熊 晶,支丽平,袁 冬

PDF(2564 KB)
PDF(2564 KB)
中文信息学报 ›› 2015, Vol. 29 ›› Issue (3) : 58-64.
语义计算

基于本体和依存句法的词汇语义关系标注及评价方法研究

  • 熊 晶1,支丽平1,袁 冬2
作者信息 +

Ontology and Dependency Syntax Based Word Semantic Relation Annotation and Its Evaluation

  • XIONG Jing1, ZHI Liping1, YUAN Dong2
Author information +
History +

摘要

为弥补传统的语义标注方法在词语或句子成分之间关系描述方面的不足,该文提出了一种基于本体和依存句法的非结构化文本语义关系标注算法。算法以句子为单位,综合POS(Part of Speech)、语义辞典、语言学特征等因素对句子中词汇的语义关系进行识别,利用词语间的依存关系对词语进行语义组合,从而实现词汇语义关系标注。结合语义标注过程中的语义匹配度、语义丰富度等特征,设计了评价算法,用以衡量标注结果的正确性。实验结果表明,该标注算法能获得较高的准确率,在大规模语料下效果尤为显著。

Abstract

In bridge the gap between words and syntactic components in current semantic annotation, a semantic annotation method based on ontology and dependency syntax for unstructured text is proposed. Applied in the sentence level, this method employs the features including POS, semantic dictionary, and other linguistic features, and determines the the lexical semantic relations by the dependency structure between them.. Meanwhile, an evaluation metric combing features like semantic similarity and semantic richness are designed, which is essentially the confidence of the method itself. Experimental results show that the semantic tagging algorithm can reach high accuracy especially on large-scale corpus.

关键词

语义标注 / 本体 / 非结构化文本 / 依存句法

Key words

semantic annotation / ontology / unstructured text / dependency syntax

引用本文

导出引用
熊 晶,支丽平,袁 冬. 基于本体和依存句法的词汇语义关系标注及评价方法研究. 中文信息学报. 2015, 29(3): 58-64
XIONG Jing, ZHI Liping, YUAN Dong. Ontology and Dependency Syntax Based Word Semantic Relation Annotation and Its Evaluation. Journal of Chinese Information Processing. 2015, 29(3): 58-64

参考文献

[1] 李业刚, 孙福振, 李鉴柏, 等. 语义角色标注研究综述[J]. 山东理工大学学报(自然科学版),2011, 25(6): 19-24.
[2] 李军辉, 王红玲, 周国栋, 等. 语义角色标注中句法特征的研究[J]. 中文信息学报,2009, 23(6): 11-18.
[3] 丁伟伟, 常宝宝. 基于语义组块分析的汉语语义角色标注[J]. 中文信息学报,2009, 23(5): 53-61.
[4] 古凌岚, 孙素云. 基于语义依存的中文本体非分类关系抽取方法[J]. 计算机工程与设计,2012, 33(4): 1676-1681.
[5] 王鑫, 穗志方. 基于依存树距离识别论元的语义角色标注系统[J]. 中文信息学报,2012, 26(2): 40-45.
[6] 徐靖, 李军辉, 朱巧明, 等. 基于短语和依存句法结构的中文语义角色标注[J]. 计算机工程,2011, 37(24): 169-172.
[7] 王步康, 王红玲, 袁晓虹, 等. 基于依存句法分析的中文语义角色标注[J]. 中文信息学报,2010, 24(1): 25-29.
[8] 陈波, 姬东鸿, 吕晨. 基于特征结构的汉语主谓谓语句语义标注研究[J].中文信息学报,2012, 26(3): 22-26.
[9] 陈叶旺, 李文, 彭鑫, 等. 基于本体的文档语义标注改进方法[J]. 东南大学学报(自然科学版),2009, 39(6): 1109-1113.
[10] 常平梅, 李冠宇, 张俊. 基于本体集成的语义标注模型设计[J]. 计算机工程与设计,2010, 31(5): 1125-1129.
[11] 戚欣, 肖敏, 孙建鹏. 基于本体知识库的自动语义标注[J].计算机应用研究,2011, 28(5):1742-1744,1747.
[12] 魏墨济, 于涛. 基于领域本体的专业文档语义标注方法[J]. 计算机应用,2011, 31(8): 2138-2142.
[13] Wimalasuriya D C, Dou D. Ontology-based information extraction: An introduction and a survey of current approaches[J]. Journal of Information Science,2010, 36(3): 306-323.
[14] Sanchez D, Isern D, Millan M. Content annotation for the semantic web: an automatic web-based approach[J],Knowledge and Information Systems. 2011, 27(3): 393-418.
[15] Zhendong Dong, Qiang Dong. HowNet and the Computation of Meaning[M].Singapore:World Scientific, 2006.
[16] 于江生, 俞士汶. 中文概念词典的结构[J]. 中文信息学报. 2002, 16(4): 12-20.
[17] 哈工大社会计算与信息检索研究中心. 语言技术平台[EB/OL][2013-2-15].http://ir.hit.edu.cn/ltp/.

基金

国家自然科学基金(60875081);河南省科技发展计划重点攻关项目(132102210264)
PDF(2564 KB)

653

Accesses

0

Citation

Detail

段落导航
相关文章

/