Abstract:This paper discusses the particular phenomenon of vowel weakening in Uyghur and proposes an algorithm to identify the Uyghur vowel weakening based on the analysis of the word structures, syllable structures, combination rules of stem plus suffixes in Uyghur language. To identify the vowel weakening, the algorithm will first locate the property of vowel weakening according to the stem database, and then determine if the stem is correctly associated with a suffix by the phonetic harmony criterion. The algorithm is readily applied in the fields of text retrieval, word frequency calculation and spelling check. The experimental results show that the algorithm is feasible and effective.
[1] 米吉提·阿不力米提,等.维吾尔语中的语音和谐规律及算法的实现[C]//中国科协2005年会.2005. [2] 米尔苏里坦·吾斯曼.现代维吾尔语文拼写与发音词典[M].乌鲁木齐: 新疆人民出版社.1997.10. [3] 池明熹.浅谈维吾尔语中元音“ ”的弱化现象[J].语言与翻译,1996,(3). [4] 米吉提·阿不力米提.在多文种环境下的维吾尔语文字校对系统的开发研究[J].系统工程理论与实践,2003,23(5): 117-124. [5] 米吉提·阿不力米提,古丽拉·阿东别克. 新疆少数民族多文种文字处理技术[C]//中日自然语言处理国际研讨会. 北京大学,2001.11. [6] 海米体·铁木尔. 现代维吾尔语语法(词汇学)[M]. 北京: 民族出版社,1987. [7] 古丽拉·阿东别克,米吉提·阿布力米提. 维吾尔语词切分方法初探[J]. 中文信息学报,2004,18(6): 61-65. [8] 米吉提·阿不力米提,艾斯卡尔·艾木都拉 吐尔地·托合提.维语词法分析器研究开发[C]//全国第11届少数民族语言文字信息处理学术研讨会.西双版纳,2007.2. [9] Gulila Adongbieke. Research of Proofreading for the Uighur Character [C]//The 2001 IEEE International Conference on System, Man and Cybernetics (SMC2001). Tucson, Arizona,U.S.A: 2001. 874-876. [10] 古丽拉·阿东别克,艾尔肯·伊米尔. 维吾尔文校对中常见错误分析[J]. 计算机工程与应用,2005.27. [11] 米吉提·阿不力米提,古丽拉·阿东别克. Research on Uighur Word Segmentation[C]//The proceedings of the China association for science and technology. 2005.12. [12] Christopher D. Manning, Hinrich Schutze.统计自然语言处理基础[M].北京: 电子工业出版社.2005. [13] James Allen.自然语言处理[M].北京: 电子工业出版社.2005. [14] Daniel Jurafsky, James H. Martin.自然语言处理综论[M].北京: 电子工业出版社.2005. [15] 李提甫·托乎提.从短语结构到最简方案——阿尔泰语言的句法结构[M].北京: 中央民族大学出版社,2004. [16] 俞士汶.计算语言学概论[M].北京: 商务印书馆出版社.2003.