引用本文:
艾孜尔古丽,艾孜海尔江,玉素甫·艾白都拉,祖力克尔江,米尔夏提. 维吾尔文初中数学教材词干分析研究[J]. 中文信息学报, 2017, 31(5): 108-113.
Azragul, Azharjan, Yusup Abaydula, Zulkarjan, Mirxat. The Study of Modern Uyghur Stems in Maths Textbook of Junior Middle School. , 2017, 31(5): 108-113.
维吾尔文初中数学教材词干分析研究
艾孜尔古丽1 ,艾孜海尔江1,2 ,玉素甫·艾白都拉1 ,祖力克尔江1,2 ,米尔夏提3
1.新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054; 2.新疆师范大学 文学院,新疆 乌鲁木齐 830054; 3.新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046
The Study of Modern Uyghur Stems in Maths Textbook of Junior Middle School
Azragul1 , Azharjan1, 2 , Yusup Abaydula1 , Zulkarjan1, 2 , Mirxat3
1.School of Computer Science and Technology, Xinjiang Normal University, Urumqi, Xinjiang 830054, China; 2.School of Liberal Arts, Xinjiang Normal University, Urumqi, Xinjiang 830054, China; 3.School of Information Science and Engineering, Xinjiang University, Urumqi, Xinjiang 830046, China
摘要 该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具,获取教材中词干基本情况、新增词干、初中数学教材高频词干,开展了初中数学维吾尔文教材词干调查,为维吾尔语研究、维吾尔文数学教学与教材编纂等提供参考依据,从而更加积极有效地促进维吾尔语语言本身研究及其信息处理的发展。
关键词 :
现代维吾尔语 ,
词干 ,
分析 ,
方法
Abstract :In this study, focused on the Uyghur mathematics textbooks in junior high school, the Uyghur stem are studied. This paper studies the basic stems in the textbooks, the new stems, and the high frequency stems. This provides reference materials for the Uighur language study, Uighur Mathematics Teaching and codification.
Key words :
modern Uygur language
word stem
analysis
method
收稿日期: 2015-08-16
基金资助: 国家自然科学基金(61662081,61463048);自治区自然科学基金(2017D01A58);自治区青年科技创新人才培养工程(QN2016BS0365);国家社科基金(14AZD11);国家语委重点项目(ZD1135-28);新疆维吾尔自治区社会科学基金(2016CYY067);国家语言资源监测与研究中心少数民族语言分中心项目(NMLR201602);新疆师范大学计算机应用重点学科、新疆师范大学数据安全重点实验室资助项目
作者简介 : 艾孜尔古丽(1987—),博士,讲师,主要研究领域为计算语言学、自然语言处理。E-mail: Azragul2010@126.com 艾孜海尔江(1991—),硕士研究生,主要研究领域为计算语言学、自然语言处理。E-mail: Azhar110@126.com 玉素甫·艾白都拉(1958—),通信作者,学士,教授,主要研究领域为计算语言学、自然语言处理。E-mail: ysp2002@126.com
[1] 哈密提. 铁木尔. 现代维吾尔语语法[M]. 北京:北京民族出版社, 1987. [2] 吴思竹, 钱庆, 胡铁军, 等. 词干提取方法及工具的对比分析研究[J], 《图书情报工作》, 2012, 56(15):109-115+142. [3] 艾孜尔古丽, 努尔艾合买提, 玉素甫·艾白都拉. 现代维吾尔语常用词统计关键技术研究[J], 中文信息学报, 2014, 28(5):192-197. [4] 艾孜尔古丽, 阿力木·木拉提, 玉素甫·艾白都拉. 基于形态分析的现代维吾尔语名词词干识别研究 [J], 中文信息学报, 2015, 37(12):2318-2323. [5] 艾孜尔古丽, 阿里木·木拉提, 苏国平. 现代维吾尔语语言资源监测中数据分析技术研究[J], 计算机应用与软件, 2013, 30(04)36-39. [6] 艾孜尔古丽, 米尔夏提, 玉素甫·艾白都拉. 现代维吾尔语词干词类标注标记集验证性研究 [J], 计算机工程与科学, 2015(6):45-48. [7] 张贯虹, 斯·劳格劳, 乌达巴拉. 融合形态特征的最大熵蒙古文词性标注模型[J], 计算机研究与发展, 2011, 48(12):2385-2390. [8] 魏顺平, 傅骞, 何克抗. 低年级小学生用字情况调查与分析——以广东、北京两地6所小学为例[J], 语言文字应用, 2008(03):81-89.
[1]
李泽魁,李雪婷,赵妍妍. 中文微博热点事件情感分布的原因分析 [J]. 中文信息学报, 2018, 32(1): 131-138.
[2]
梁金莲,古丽拉·阿东别克. 由粗到精的哈萨克语短语结构句法分析研究 [J]. 中文信息学报, 2018, 32(1): 83-88.
[3]
何馨宇,李丽双. 基于双向LSTM和两阶段方法的触发词识别 [J]. 中文信息学报, 2017, 31(6): 147-154.
[4]
周强. 汉语日常会话的对话行为分析标注研究 [J]. 中文信息学报, 2017, 31(6): 75-82.
[5]
林子琦,倪晚成,赵美静,杨一平. 基于概念知识树的双宾短语分析 [J]. 中文信息学报, 2017, 31(5): 21-31,49.
[6]
吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉. 基于统计和浅层语言分析的维吾尔文语义串快速抽取 [J]. 中文信息学报, 2017, 31(4): 70-79.
[7]
王加楠,鲁 强. 基于模式的远监督关系抽取算法 [J]. 中文信息学报, 2017, 31(4): 122-131.
[8]
陈 畅,魏晶晶,廖祥文,林柏钢,陈国龙. 融合用户观点的社会影响力分析 [J]. 中文信息学报, 2017, 31(4): 191-198.
[9]
陈毅恒,李雪婷,王 彪,刘 挺. 基于网络结构的多种用户影响力分析算法对比研究 [J]. 中文信息学报, 2017, 31(4): 216-222.
[10]
杨 阳;林鸿飞;杨 亮;任巨伟. 大数据时代的计算政治学研究 [J]. 中文信息学报, 2017, 31(3): 9-16.
[11]
李 旸;郭晓敏;王素格;梁吉业;. 基于内涵模糊概念格的汽车评价知识发现方法研究 [J]. 中文信息学报, 2017, 31(3): 69-76.
[12]
杜 慧;徐学可;伍大勇 ;刘 悦;余智华;程学旗. 基于情感词向量的微博情感分类 [J]. 中文信息学报, 2017, 31(3): 170-176.
[13]
周 文;欧阳纯萍;阳小华;刘志明;张书卿;饶 婕. 一种基于情感依存元组的简单句情感判别方法 [J]. 中文信息学报, 2017, 31(3): 177-183.
[14]
万圣贤;兰艳艳;郭嘉丰;程学旗;. 基于弱监督预训练深度模型的微博情感分析 [J]. 中文信息学报, 2017, 31(3): 191-197.
[15]
刘梅彦,黄改娟. 面向信息内容安全的文本过滤模型研究 [J]. 中文信息学报, 2017, 31(2): 126-131.