藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3%和97.4%,在开放测试集上的准确率、召回率和F1值分别达96.0%、95.4%和95.7%。
Abstract
The syntax analysis of Tibetan interrogative sentences has broad application prospects such as in Tibetan question answering system, search engine, information extraction and retrieval. By analyzing the features of Tibetan interrogative sentences, this paper classified the Tibetan interrogative sentences and summarized the structural features of various Tibetan interrogative sentences. The PCFG method is utilized to parse the Tibetan interrogative sentences. The experiment reveals 96.0%, 95.4% and 95.7% in accuracy, recall and F value, respectively.
关键词
藏文疑问句 /
疑问代词 /
句法分析 /
PCFG /
CYK
{{custom_keyword}} /
Key words
Tibetan interrogative sentence /
interrogative pronoun /
syntactic analysis /
PCFG /
CYK
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 完么才让.基于规则的藏语句法分析研究[D].青海: 青海民族大学硕士学位论文,2014.
[2] 周青宇.基于深度学习的自然语言句法分析研究[D].哈尔滨: 哈尔滨工业大学硕士学位论文,2016.
[3] 王鹏,戴新宇,陈家骏,等.基于规则的汉语句法分析方法研究[J].计算机工程与应用,2003, 39(29): 63-66.
[4] 袁里驰.基于统计的句法分析方法[J].中南大学学报(自然科学版),2014(8): 2669-2675.
[5] 林颖,史晓东,郭锋.一种基于概率上下文无关文法的汉语句法分析[J].中文信息学报,2006,20(2): 1-7.
[6] 魏莉.规则和统计相结合的句法分析——一致性检验[J]. 山西广播电视大学学报,2014(3): 40-42.
[7] 辛霄,范士喜,王轩,等.基于最大熵的依存句法分析[J]. 中文信息学报,2009,23(2): 18-22.
[8] 完玛扎西.藏语句法分析系统的研究与实现[D].拉萨: 西藏大学硕士学位论文,2013.
[9] 华却才让,赵海兴.基于判别式的藏语依存句法分析[J]. 计算机工程,2013,39(4): 300-304.
[10] 华却才让,赵海兴.藏文复合句的依存句法分析[J].中文信息学报,2016,30(6): 224-229.
[11] 扎西吉,才智杰,拉玛扎西.藏语判断句的句法结构树构建方法[J].西北民族大学学报(自然科学版),2017(4):24-27.
[12] 吉太加.现代藏语文法通论[M].兰州:甘肃民族出版社,2000.
[13] 吉太加.藏语句法研究[M].北京:中国藏学出版社,2013.
[14] 才智杰,才让卓玛.班智达藏文标注词典设计[J].中文信息学报,2010,24(5): 46-49.
[15] 柔特.藏文问答系统中问句的分类方法研究[J].计算机工程与科学,2015,37(7): 1393-1398.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
国家自然科学基金(61866032,61163018,61262051);国家社会科学基金(13BYY141,16BYY167,15BYY167);教育部“春晖计划”合作科研项目(Z2012093,Z2016077);青海省基础研究项目(2017-ZJ-767,2019-SF-129,2015-SF-520);“长江学者和创新团队发展计划”创新团队资助项目(IRT1068);青海省重点实验室项目(2013-Z-Y17、2014-Z-Y32、2015-Z-Y03);藏文信息处理与机器翻译重点实验室(2013-Y-17);青海师范大学2018—2019年度创新训练项目
{{custom_fund}}