基于结构检索的汉语介动搭配知识库构建

王诚文,饶高琦,荀恩东

PDF(2392 KB)
PDF(2392 KB)
中文信息学报 ›› 2023, Vol. 37 ›› Issue (7) : 23-31.
语言分析与计算

基于结构检索的汉语介动搭配知识库构建

  • 王诚文1,饶高琦2,荀恩东3
作者信息 +

Construction of Preposition-verb Knowledge Base Based on Structure Retrieval

  • WANG Chengwen1, RAO Gaoqi2, XUN Endong3
Author information +
History +

摘要

以往的介词知识库构建重视介词语义和介宾的搭配研究,鲜有对介动搭配进行系统研究及知识获取的工作。而汉语介词发达及动词是句子中心的特征决定了介动搭配研究的重要性。该文基于结构检索技术,充分借助短语结构属性和结构信息,从大规模语料中抽取介动搭配16 033对,并提出了介动搭配紧密度的度量方法,初步分析证明该方法远优于依靠绝对频次进行搭配度量的方法。

Abstract

In contrast to the well addressed prepositional semantic and referential collocation, there had been few systematic research on knowledge extraction and knowledge-base construction for preposition-verb collocations. The study of preposition-verb collocations is especially crucial in that Chinese prepositions are well-developed and the Chinese sentences are centered around verbs. This paper extracts 16 033 pairs of preposition-verb collocations from a large-scale corpus via a technology of structure retrieval according to the phrase structure attributes. A method for measuring the closeness of a preposition-verb collocation is also described, which is preliminarily revealed to be superior to the raw frequency.

关键词

介动搭配 / 结构检索 / 介动紧密度

Key words

preposition-verb collocation / structure retrieval / closeness of preposition-verb collocation

引用本文

导出引用
王诚文,饶高琦,荀恩东. 基于结构检索的汉语介动搭配知识库构建. 中文信息学报. 2023, 37(7): 23-31
WANG Chengwen, RAO Gaoqi, XUN Endong. Construction of Preposition-verb Knowledge Base Based on Structure Retrieval. Journal of Chinese Information Processing. 2023, 37(7): 23-31

参考文献

[1] 胡韧奋,肖航.面向二语教学的汉语搭配知识库构建及其应用研究[J].语言文字应用,2019(01):135-144.
[2] 范晓.介宾短语·复指短语·固定短语[M].北京: 人民教育出版社.1990.
[3] 张谊生.现代汉语虚词[M].上海: 华东师范大学出版社.2000.
[4] 陈昌来.介词与介引功能[M].合肥: 安徽教育出版社.2002.
[5] 刘丹青.汉语中的框式介词[J].当代语言学,2002(04): 241-253.
[6] 张旺熹.汉语介词衍生的语义机制[J].汉语学习,2004(01):1-11.
[7] 何洪峰,张文颖.汉语动介并行现象[J].语言研究,2016,36(04):21-27.
[8] 刘静敏.动词介词化的句法语义机制[J].语文建设,2015(21):34-35.
[9] 邹宏梅,王挺.SVM和基于转换的错误驱动学习相结合的汉语组块识别[J].计算机工程与科学,2007(04):91-94.
[10] 王莹莹. 汉语组块识别的研究[D].大连:大连理工大学硕士学位论文,2006.
[11] 高红.基于统计语言模型的汉语浅层分析研究[D].大连:大连理工大学博士学位论文,2007.
[12] 方清明.现代汉语介词用法词典[M].北京: 商务印书馆.2017.
[13] 俞士汶.现代汉语广义虚词知识库的建设[J].汉语语言与计算机学报,2003(01):89-98.
[14] 彭爽,俞士汶.现代汉语介词知识库的建设[J].社会科学战线,2009(08):247-249.
[15] 邢丹,饶高琦,荀恩东,王诚文.基于大规模语料库的介词结构搭配库构建[J].中文信息学报,2020,34(11):1-8.
[16] 俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996(02):1-22.
[17] CHEN Y, XU L, LIU K, et al. Event extraction via dynamic multi-pooling convolutional neural networks[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing, 2015: 167-176.
[18] 詹卫东.论元结构与句式变换[J].中国语文,2004(03):209-221.
[19] 吕叔湘, 朱德熙.语法修辞讲话[M].北京: 中国青年出版社,1952.
[20] 范晓.汉语动词概述[M]. 上海:上海教育出版社,1987.
[21] 吴为章.“动词中心”说及其深远影响——《中国文法要略》学习札记[J].语言研究,1994(01):10-20.

基金

国家自然科学基金(62076038)
PDF(2392 KB)

Accesses

Citation

Detail

段落导航
相关文章

/