汉语二语教学领域词义标注语料库的研究及构建

王 敬;杨丽姣;蒋宏飞;苏靖杰;付静玲

PDF(2316 KB)
PDF(2316 KB)
中文信息学报 ›› 2017, Vol. 31 ›› Issue (1) : 221-229.
语言资源建设

汉语二语教学领域词义标注语料库的研究及构建

  • 王 敬,杨丽姣,蒋宏飞,苏靖杰,付静玲
作者信息 +

A Word Sense Annotated Corpus
for Teaching Chinese as Second Language

  • WANG Jing, YANG Lijiao, JIANG Hongfei, SU Jingjie, FU Jingling
Author information +
History +

摘要

词汇教学在汉语二语教学领域占有极为重要的地位,其中多义词又是词汇教学的重点和难点。该研究通过分析三部经典领域词表,选取了1 181个重点多义词,以《现代汉语词典(第6版)》为标注体系,制定了适合实际标注的多义词标注规范和形式,在197册经典汉语二语教材上进行了多义词词义标注,构建了一个规模约350万字的面向汉语二语教学领域的词义标注语料库,并在此基础上对1 811个多义词、4 323个多义词义项进行了计量统计,分析了多义词不同词义的出现情况及其分布规律。为了更好地服务于汉语二语教学,开发了语料库检索系统,设计并实现了多义词义项的查询功能。

Abstract

In field of teaching Chinese as a second language, the teaching of word is very important, in which polysemous word is a challenging issue. After a survey of 3 classical vocabularies in this field, this paper selects 1 181 polysemous words. Then an annotation specification is designed, with a reference to Modern Chinese Dictionary (Edition 6). Tagging the 1 181 words appeared in 197 popular Chinese textbooks yields a corpus with word senense annotation over 3.5 million characters. A quantitative study on the 1 811 polysemous words is also made, with an analysis of the distribution of total 4 323 word senses.

关键词

汉语二语教学 / 语料库 / 多义词标注

Key words

teaching Chinese as a second language / corpus / polysemous words annotation

引用本文

导出引用
王 敬;杨丽姣;蒋宏飞;苏靖杰;付静玲. 汉语二语教学领域词义标注语料库的研究及构建. 中文信息学报. 2017, 31(1): 221-229
WANG Jing; YANG Lijiao; JIANG Hongfei; SU Jingjie; FU Jingling. A Word Sense Annotated Corpus
for Teaching Chinese as Second Language. Journal of Chinese Information Processing. 2017, 31(1): 221-229

参考文献

[1] Ide N, Wilks Y. Making sense about sense[J]. Word Sense Disambiguation. Dordrecht: : Springer,2007,33: 47-73.
[2] Leech G. Corpus annotation schemes[J]. Literary and Linguistic Computing,1993,8(4): 275 -281.
[3] Sinclair J. Corpus, concordance, collocation[M]. Oxford: Oxford University Press,1991.
[4] 符淮青. 现代汉语词汇 (增订本第二版)[J]. 北京: 北京大学,2004: 63.
[5] 国家汉办/孔子学院总部. 新汉语水平考试大纲[M]. 北京: 商务印书馆,2009.
[6] 金澎, 吴云芳, 俞士汶. 词义标注语料库建设综述[J]. 中文信息学报,2008,22(03): 16-23.
[7] 李如龙, 吴茗. 略论对外汉语词汇教学的两个原则[J]. 语言教学与研究,2005,2(41): 21.
[8] 刘英林, 马箭飞. 汉语国际教育用音节汉字词汇等级划分[M]. 北京: 北京语言大学出版社, 2010.
[9] 吴云芳, 俞士汶. 信息处理用词语义项区分的原则和方法[J]. 语言文字应用,2006, 2: 126-133.
[10] 肖航, 杨丽姣. 基于词典的语料库词义标注研究[J]. 语言文字应用, 2010, 2: 135-141.
[11] 肖航. 基于词典的语料库词义标注[D]. 新加坡: 新加坡国立大学, 2009.
[12] 杨寄洲, 贾永芬. 1700 对近义词语用法对比[M]. 北京: 北京语言大学出版社,2005.
[13] 中国社会科学院语言研究所词典编辑室.《现代汉语词典》(第6版)[M]. 北京: 商务印书馆, 2012.

基金

国家语委“十二五”科研规划项目(YB125-124);国家高技术研究发展计划(863)(NO.2012AA011104);中国博士后科学基金第53批面上资助(一等)(2013M530026)
PDF(2316 KB)

686

Accesses

0

Citation

Detail

段落导航
相关文章

/