引用本文:
王辉,努尔麦麦提·尤鲁瓦斯,吾守尔·斯拉木. 维吾尔语音素的声学特征分析[J]. 中文信息学报, 2014, 28(1): 100-106.
WANG Hui, NURMEMET Yolwas, WUSHOUER Silamu. Acoustic Feature Analysis of the Uyghur Phonemes. , 2014, 28(1): 100-106.
维吾尔语音素的声学特征分析
王辉1 ,努尔麦麦提·尤鲁瓦斯1,2 ,吾守尔·斯拉木1,2
1. 新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046; 2. 新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046
Acoustic Feature Analysis of the Uyghur Phonemes
WANG Hui1 , NURMEMET Yolwas1,2 , WUSHOUER Silamu1,2
1. Faculty of Information Science and Engineering, Xinjiang University, Urumqi, Xinjiang 830046, China; 2. Key Laboratory of Multilingual Information Technology, Urumqi, Xinjiang 830046, China
摘要 该文对不同语速下,人工标注的维吾尔语连续语音语料中各音素进行共振峰频率、音长、音强的统计分析,并完成辅-元结构下的塞音、塞擦音的声学特征分析。该文通过美尔频率倒谱系数与共振峰频率等声学特征的融合及模型状态数的修改,对维吾尔语音素识别的声学模型进行了改进,并验证了不同声学特征对音素识别的影响。相比于基线系统,改进后声学模型的识别率取得一定提升。同时,利用语音学知识分析维吾尔语易混淆音素产生原因,为音素识别声学模型的进一步改进提供参考依据。
关键词 :
维吾尔语 ,
声学特征 ,
特征融合 ,
语速
Abstract :Employing manually labeled continuous speech sentences, this paper conducts an analysis of each Uyghur phonemes formant frequency, duration and intensity by the classification of speech rate. To study Uyghur plosive and affricate, the paper makes the analysis of their acoustic feature under the structure of consonant-vowel. Feature fusion and the change of models state number are applied to validate the influences of different acoustic features to the Uyghur phoneme recognition. It also describes an improved acoustic model with a higher recognition rate. Meanwhile, the analysis of confusing phonemes provides a reference for the further improvement of Uyghur acoustic models.
Key words :
Uyghur
acoustic feature
feature fusion
speech rate
收稿日期: 2012-03-26
基金资助: 新疆多语种信息处理重点实验室开放课题(049807)
作者简介 : 王辉(1988-),硕士研究生,主要研究领域为维吾尔语语音识别。努尔麦麦提·尤鲁瓦斯(1980-),博士,讲师,主要研究领域为自然语言处理、语音识别。吾守尔·斯拉木(1942-),中国工程院院士,教授。主要研究领域为多语种信息处理、计算机应用及网络技术研究与开发应用。
[1] Young S, Evermann G, Gales M. The HTK Book [EB/OL]. 2009, http://htk.eng.cam.ac.uk/. [2] 鲍怀翘,阿西木. 维吾尔语元音的声学语音学分析[J]. 民族语文,1988,(5):4-13. [3] 吴宗济,林茂灿. 实验语音学概要[M]. 北京:高等教育出版社, 1989:87-124. [4] 林焘,王理嘉. 语音学教程[M]. 北京:北京大学出版,1992:64-87. [5] 麦热哈巴·艾力,姜文斌,吐尔根·依布拉音. 维吾尔语词法中音变现象的自动还原模型[J]. 中文信息学报,2012,26(1):91-95. [6] 伊·达瓦,匂坂芳典,中村哲. 语料资源缺乏的连续语音识别方法的研究[J]. 自动化学报,2010,36(4):550-557. [7] 赵相如,朱志宁. 维吾尔语简志[M]. 民族出版社,1983:4-33. [8] 那斯尔江·吐尔逊,吾守尔·斯拉木. 基于隐马尔科夫模型的维吾尔语连续语音识别系统[J]. 计算机应用,2009,29(7):2009-2012. [9] 祖丽皮亚·阿曼,艾斯卡尔·艾木都拉. 基于音素及其特征参数的维吾尔语音合成技术[J]. 中文信息学报,2008,22(4):100-104.
[1]
玛尔哈巴·艾赛提;艾孜尔古丽;玉素甫·艾白都拉. 基于语法的维吾尔语情感词汇自动获取 [J]. 中文信息学报, 2017, 31(1): 126-132.
[2]
孙 晓;何家劲;任福继. 基于多特征融合的混合神经网络模型讽刺语用判别 [J]. 中文信息学报, 2016, 30(6): 215-223.
[3]
倪耀群,许洪波,程学旗. 基于多特征融合和图匹配的维汉句子对齐 [J]. 中文信息学报, 2016, 30(4): 124-133.
[4]
赛牙热·依马木,于斯音·于苏普,阿不都萨拉木·达吾提. 拉丁化维吾尔文字特征及其基于规则的正规化 [J]. 中文信息学报, 2016, 30(3): 60-67.
[5]
努尔麦麦提·尤鲁瓦斯,张力文,吾守尔·斯拉木. 说话人自适应技术在维吾尔语语音识别中的应用研究 [J]. 中文信息学报, 2016, 30(3): 79-84.
[6]
木合塔尔·沙地克,布合力齐姑丽·瓦斯力, 李 晓. 面向维吾尔语关键词检索的等宽切词算法 [J]. 中文信息学报, 2016, 30(2): 207-212.
[7]
罗亚伟, 田生伟, 禹 龙, 吐尔根·依布拉音, 艾斯卡尔·艾木都拉. 细粒度意见挖掘中维吾尔语文本情感分析研究 [J]. 中文信息学报, 2016, 30(1): 140-148.
[8]
王慧云,禹 龙,田生伟, 加米拉·吾守尔,冯冠军. 维吾尔语比较句识别研究 [J]. 中文信息学报, 2016, 30(1): 148-156.
[9]
艾孜尔古丽,阿力木·木拉提,玉素甫·艾白都拉. 基于形态分析的现代维吾尔语名词词干识别研究 [J]. 中文信息学报, 2015, 29(6): 208-212.
[10]
赛迪亚古丽·艾尼瓦尔,向 露,宗成庆,艾克白尔·帕塔尔,艾斯卡尔·艾木都拉. 融合多策略的维吾尔语词干提取方法 [J]. 中文信息学报, 2015, 29(5): 204-211.
[11]
古力努尔·艾尔肯,祖丽皮亚·阿曼,地里木拉提·吐尔逊. 维吾尔语三音节词中元音和谐的声学特征分析 [J]. 中文信息学报, 2015, 29(4): 199-206.
[12]
米莉万·雪合来提,刘 凯,吐尔根·依布拉音. 基于维吾尔语词干词缀粒度的汉维机器翻译 [J]. 中文信息学报, 2015, 29(3): 201-206.
[13]
徐宝龙,努尔麦麦提·尤鲁瓦斯,吾守尔·斯拉木. 关于维吾尔语口语语料的三音子选取方法研究 [J]. 中文信息学报, 2015, 29(2): 118-124.
[14]
田生伟,钟军,禹龙. 维吾尔语多词领域术语的自动抽取 [J]. 中文信息学报, 2015, 29(2): 133-141.
[15]
艾孜尔古丽,努尔艾合买提,玉素甫·艾白都拉. 现代维吾尔语常用词统计关键技术研究 [J]. 中文信息学报, 2014, 28(5): 192-197.