维吾尔语元音的声频特性分析和识别

王昆仑1, 张贯虹1, 吐尔洪江·阿布都克力木2

PDF(864 KB)
PDF(864 KB)
中文信息学报 ›› 2010, Vol. 24 ›› Issue (2) : 122-129.
综述

维吾尔语元音的声频特性分析和识别

  • 王昆仑1, 张贯虹1, 吐尔洪江·阿布都克力木2
作者信息 +

Analysis of Acoustic Frequency Feature for Uighur Vowels and Their Identification

  • WANG Kunlun1,ZHANG Guanhong1, Turghunjan Abdukirim 2
Author information +
History +

摘要

维吾尔语属阿尔泰语系突厥语族,由于其构词法的特点,八个元音的声频特性在语音识别中,尤其是识别基元选取中有重要作用,其共振峰频率参数也是语音识别和语音合成的重要依据。运用实验语音学的基本理论和方法,在维吾尔语综合语音数据库的办公环境语料条件下,对维吾尔语八个元音进行了声频特性统计分析,给出了维吾尔语元音共振峰频率参数和分布规律,并通过八个元音的语音识别实验结果,验证了其共振峰频率分布规律的正确性。实验证明:维吾尔语在排除元音和谐情况下,其声频特性具有很强的可区分性,对于实现语音信息的传送接受正确性很高。

Abstract

As a Turkic Altaic language, Uighur has a unique word-building in which its eight vowels have very important roles for speech recognition and synthesis, especially for selection of recognition base unit. Focused on the acoustic frequency characteristics and the formant frequency parameters of the Uighur vowels, this paper adopts the basis theory and method of experimental phonetics to reveal the vowels’formant frequency distribution rules on the Uighur synthetic speech database(office environment). The accuracy of the formant frequency distribution parameter of Uighur’s eight vowels is further validated in the speech recognition test. The experiment confirms that the Uighur is more distinguishable in the audio frequency for the correctness in the speech transmission and receival if removing the vowel harmonious phenomena.
Key wordscomputer application; Chinese information processing;speech recognition; acoustic frequency characteristics; formant frequency; vowel; Uighur

关键词

计算机应用 / 中文信息处理 / 语音识别 / 声频特性 / 共振峰频率 / 元音 / 维吾尔语

Key words

computer application / Chinese information processing / speech recognition / acoustic frequency characteristics / formant frequency / vowel / Uighur

引用本文

导出引用
王昆仑1, 张贯虹1, 吐尔洪江·阿布都克力木2. 维吾尔语元音的声频特性分析和识别. 中文信息学报. 2010, 24(2): 122-129
WANG Kunlun1,ZHANG Guanhong1, Turghunjan Abdukirim 2. Analysis of Acoustic Frequency Feature for Uighur Vowels and Their Identification. Journal of Chinese Information Processing. 2010, 24(2): 122-129

参考文献

[1] 呼和. 蒙古语元音的声学分析[J]. 民族语文,1999,(4):58-60.
[2] 伊·达瓦,大川茂村,白井克彦. 蒙古语七个元音声频特性计算机分析[J]. 声学学报,1999,24(1):94-97.
[3] 李净,郑方,张继勇,吴文虎. 汉语连续语音识别中上下文相关的声韵母建模[J]. 清华大学学报(自然科学版),2004,44(1):61-64.
[4] 曹剑芬,李爱军,胡方,张利刚. 语音学知识在语音识别中的应用[J]. 清华大学学报(自然科学版),2008,S1:748-753.
[5] 张家騄.汉语普通话区别特征系统[J]. 声学学报,2005,30(6):506-514.
[6] 易斌. 现代维吾尔语元音/i/的实验分析[J]. 语言与翻译(汉文),2008,(1):20-24.
[7] 陶梅,吾守尔·斯拉木,那斯尔江·吐尔逊. 基于HTK的维吾尔语连续语音声学建模[J].中文信息学报, 2008, 22(5):56-59.
[8] 王昆仑. 维吾尔语音节语音识别基元的研究[J]. 计算机科学,2003, 30(7):182-184.
[9] 王昆仑. 基于CDCPM的维吾尔语非特定人语音识别[J]. 计算机研究与发展,2001,38(10): 1242-1246.
[10] 王昆仑,樊志锦,吐尔洪江,方晓华,徐绍琼,吾买尔.维吾尔语综合语音数据库系统[C]//第五届全国人机语音通讯学术会议论文集,1998.
[11] 杨行骏. 语音信号与数字处理[M]. 电子工业出版社,1995.
[12] Delattre,P. The physiological interpretation of sound spectrogram[M]. PLMA, Vol LXVI(5), 1951.
[13] 吴宗济. 普通话单音节语图册[M]. 中国社会科学出版社,1986.
[14] http://htk.eng.cam.ac.uk/.
附录A 维吾尔语元音共振峰频率统计表

基金

国家自然科学基金资助项目(10661010)
PDF(864 KB)

Accesses

Citation

Detail

段落导航
相关文章

/