短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。 该文在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则对短语进行分类,并规定了信息处理中藏语短语类别单位的标记代码。
Abstract
Phrase is an important linguistic phenomenon. At present, the research of Tibetan phrases for information processing has just started. This paper investigates the boundary between Tibetan phrases and Tibetan sentences, and proposes the classification of Tibetan phrases for Tibetan information processing. Types of Tibetan phrases and the annotation scheme are also provided.
关键词
藏语 /
短语 /
分类 /
标记
{{custom_keyword}} /
Key words
Tibetan /
phrase /
classification /
annotation scheme
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 万福成,于洪志.面向机器翻译的藏语短语句法研究[J].计算机工程与应用,2015,51(13):211-216.
[2] 郁梅,张国煊,王小华.基于规则的汉语短语边界划分的研究[J].苏州大学学报(自然科学版),1994(10):226-232.
[3] 吉太加.现代藏文语法通论[M].甘肃:甘肃民族出版社,2000.
[4] 多识.藏文语法注释大全[M].甘肃:甘肃民族出版社,1987:28.
[5] 吉太加.藏语句法研究[M].北京:中国藏学出版社,2013:43.
[6] 才藏太.基于最大熵分类器的藏文句子边界自动识别方法研究[J].计算机科学与工程,2012,34(6):130-133.
[7] 才藏太.藏语语料库的建设及其深加工方法研究[J].计算机工程与应用,2012,48(66):127-131.
[8] Garside R Leech G,Sampson G.The Computational aualysis of English[M].Longman,1987.
[9] Mitchell P Marcus,Mary Ann Marcinkiewicz,Beatrice Santorini.Buiding a large annotated corpus of English:The Penn Treebank[J].Computational Linguistics,1993,19(2):313-330.
[10] 周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11.
[11] 江荻.现代藏语动词的句法语义分类及相关语法句式[J].中文信息学报,2006,20(1):111-115.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
国家自然科学基金(61866032,61550006,61063033,61662061);国家社科基金(15BYY167,17XYY030);青海省科技厅项目(2015-SF-520)
{{custom_fund}}