语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语语义知识库的方法。该方法根据航空术语的特点将辅助构建分成四个关键过程,构建了2 000条术语概念描述(DEF)。最后通过对人工标注的术语间相似度与根据术语DEF计算的术语间相似度结果的对比,验证了该构建方法的有效性。
Abstract
Semantic knowledge base is a basic resource of natural language processing. The existing large-scale semantic knowledge base is basically generic knowledge base, lacking the domain specific semantic knowledge. This paper proposes a semi-automatic method of constructing the semantic knowledge base of aviation terms by HowNet. It consists of four key processes of construction, resulting altogether 2 000 descriptions of the term concept (DEF). Finally, the validity of the method is verified by comparing the term similarities obtained by manual annotation and those obtained according to the term DEF.
关键词
航空术语 /
语义知识库 /
知网 /
概念描述
{{custom_keyword}} /
Key words
aviation terms /
semantic knowledge base /
HowNet /
DEF
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 董振东,董强.知网[EB/OL].http: //www.keenage.com/.
[2] 刘扬,俞士汶,于江生.CCD语义知识库的构造研究[J].小型微型计算机系统,2005,26(8): 1411-1415.
[3] You L,Liu T,Liu K.Chinese FrameNet and OWL representation[C]//Prpceedings of the 6the International Conference on Advanced Language Processing and Web Information Technology.IEEE Computer Society,2007: 140-145.
[4] 陈群秀,黄昌宁.现代汉语述语动词机器词典研究初探[C].全国计算机语言学联合学术会议,1993.
[5] 董振东,董强.建设中文词汇语义资源中的一些问题和我们的对策[EB/OL].http: //www.keenage.com.
[6] 郝长伶,董强.知网知识库描述语言[C].全国计算语言学联合学术会议,2003.
[7] 董振东,董强.面向信息处理的词汇语义研究中的若干问题[J].语言文字应用,2001(3): 27-32.
[8] 张桂平,刁丽娜,王裴岩.基于HowNet的航空术语语义知识库的构建[J].中文信息学报,2014,28(5): 92-101.
[9] 王羊羊,等.基于HowNet的术语语义知识库构建技术[J].沈阳航空航天大学学报,2016,33(4): 78-84.
[10] 冯志伟.特思尼耶尔的从属关系语法[J].当代语言学,1983,(1): 63-65.
[11] 陈小芳,等.基于统计和规则相结合的汉语术语语义分析方法[C].全国信息检索学术会议.2010.
[12] 周其焕.航空术语的构词分析[J].中国民航大学学报,2007,25(4): 60-64.
[13] 刘挺,车万翔,李生.基于最大熵分类器的语义角色标注[J].软件学报,2007,18(3): 565-573.
[14] Berger A L,et al.A maximum entropy approach to natural language processing[J].Computational Linguistics,1996,22(1): 39-71.
[15] 夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6): 191-194.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
教育部人文社会青年科学研究基金(17YJC740087)
{{custom_fund}}