引用本文:
边巴旺堆,卓 嘎, 董志诚,武 强,王龙业. 藏文排序优先级算法研究[J]. 中文信息学报, 2015, 29(1): 191-196.
Bianba Wangdui, Drolkar, DONG Zhicheng, WU Qiang, WANG Longye. Study on the Sorting Algorithm of Tibetan Dictionary. , 2015, 29(1): 191-196.
藏文排序优先级算法研究
边巴旺堆,卓 嘎, 董志诚,武 强,王龙业
西藏大学 工学院,西藏 拉萨 850000
Study on the Sorting Algorithm of Tibetan Dictionary
Bianba Wangdui, Drolkar, DONG Zhicheng, WU Qiang, WANG Longye
School of engineering, Tibet University, Lhasa, Tibet 850000, China
摘要 为了顺利实现藏文词语的排序算法,在藏文构件元素识别算法的基础上,该文通过建立藏文规则函数和定义藏文构件的优先级,提出了基于笛卡尔积数学模型的现代藏文音节的优先级算法。该方法既遵循藏文构词原则,又符合语法规则,同时为藏文词语排序算法提供了新的研究思路。最后该文用藏文“ ”系的所有满足语法规则的词语对本算法进行测试,结果表明该算法符合现代藏文词典的排序要求,且排序效率更好。
关键词 :
规则函数 ,
优先级 ,
藏文 ,
算法
Abstract :In this paper, a sorting algorithm for cotemporary Tibetan syllable is presented by Cartesian product on the basis of a definition of Tibetan component priotiry. This method conforms to the Tibetan morphology and syntax. Finally, all grammar rules that related the Tibetan syllable ‘ ’ are tested and it proves that the algorithm meets the demands of the contemporary Tibetan dictionary.
Key words :
rule function
priority
Tibetan
algorithm
收稿日期: 2014-01-26
基金资助: 国家自然科学基金(61163013);国家自然科学基金(1261021)
作者简介 : 董志诚(1980—),博士研究生,主要研究领域为第五代通信技术及藏文嵌入式系统。E-mail: 65202557@qq.com
[1] 扎西次仁.藏文的排序规则及其计算机自动排序的实现[J].中国藏学研究.1999(04):128-135. [2] 江荻,周季文.论藏文的序性及排序方法[J]. 中文信息学报,2000,14(1): 56-64. [3] 江荻,康才. 书面藏语排序的数学模型及算法[J]. 计算机学报,2004,4:524-529. [4] 黄鹤鸣 赵晨星. 基于DUCET的藏文排序方法[J].中文信息学报,2008,22(4):109-113. [5] 珠杰,欧珠.基于藏文编码GB的藏文排序方法研究[J]. 西藏大学学报(自然科学版). 2008(01): 33-35. [6] 刘萍,黄鹤鸣. 现代藏文音节排序的算法设计[J].西北师范大学自然学报.2012(06): 44-47. [7] 边巴旺堆,卓嘎,陈延利,等. 藏文构件元素识别算法研究[J].中文信息学报,2014,28(3):26-33. [8] 东嘎洛桑赤来.东嘎大辞典[M].北京: 中国藏学出版社,2002. [9] 怡孙主编.藏汉大辞典[M].北京: 民族出版社.1984. [10] 边巴旺堆. 基于ISO/IEC10646藏文编码字符集标准的藏文排序算法设计与实现. 西藏大学工学院硕士学位论文.2009.
[1]
郑亚楠;珠 杰;. 基于词向量的藏文词性标注方法研究 [J]. 中文信息学报, 2017, 31(1): 112-117.
[2]
华却才让;赵海兴. 藏文复合句的依存句法分析 [J]. 中文信息学报, 2016, 30(6): 224-229.
[3]
郗亚辉. 产品评论中领域情感词典的构建 [J]. 中文信息学报, 2016, 30(5): 136-144.
[4]
姚子瑜,屠守中,黄民烈,朱小燕. 一种半监督的中文垃圾微博过滤方法 [J]. 中文信息学报, 2016, 30(5): 176-186.
[5]
郗亚辉. 产品评论挖掘中特征同义词的识别 [J]. 中文信息学报, 2016, 30(4): 150-158.
[6]
孙水华,黄德根,牛萍. 中医针灸领域术语自动抽取研究 [J]. 中文信息学报, 2016, 30(3): 118-124.
[7]
陈小莹,艾金勇. 基于小字符集藏文拉丁转写系统的设计与实现 [J]. 中文信息学报, 2016, 30(3): 74-78.
[8]
马志强,张泽广,闫 瑞,刘利民,冯永祥,苏依拉. 基于N-Gram模型的蒙古语文本语种识别算法的研究 [J]. 中文信息学报, 2016, 30(1): 133-140.
[9]
王慧云,禹 龙,田生伟, 加米拉·吾守尔,冯冠军. 维吾尔语比较句识别研究 [J]. 中文信息学报, 2016, 30(1): 148-156.
[10]
李亚超,江 静,加羊吉,于洪志. TIP-LAS:一个开源的藏文分词词性标注系统 [J]. 中文信息学报, 2015, 29(6): 203-207.
[11]
洛桑嘎登,杨媛媛,赵小兵. 基于知识融合的CRFs藏文分词系统 [J]. 中文信息学报, 2015, 29(6): 213-219.
[12]
吕国英,苏 娜,李 茹,王智强,柴清华. 基于框架的汉语篇章结构生成和篇章关系识别 [J]. 中文信息学报, 2015, 29(6): 98-109.
[13]
刘作国,陈笑蓉. 高斯加权的重构性K-NN算法研究 [J]. 中文信息学报, 2015, 29(5): 112-117.
[14]
牛 耘,张 黎,王世泓,魏 欧. 基于多层次语言特征的弱监督评论倾向性分析 [J]. 中文信息学报, 2015, 29(4): 80-88.
[15]
向春丞, 穗志方, 詹卫东. HowNet与CCD映射方法研究 [J]. 中文信息学报, 2015, 29(3): 44-51.