在基于语料库的语音合成方法中,语音合成单元选择的优劣直接影响合成语音的自然度和流畅性。该文针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法。主观评价与客观评测数据表明该策略与算法有效和合理,各类合成单元在开放语料上的覆盖率与语音合成效果均达到预期的目标。
Abstract
In the corpus-based text to speech system, the choices of unit selection impact directly on the quality of synthesized speech. By analyzing the features of Tibetan language, this paper proposes not only a hybrid strategy which mixed components, characters, words and sentences, but also a corpus-based unit selection algorism for Tibetan Speech Synthesis. Subjective assessment results and objective evaluation results indicate that the algorithms are effective, the coverage and synthesized speech of units are satisfactory reached expected target.
关键词
语音合成 /
单元选择 /
基本构件 /
组合构件
{{custom_keyword}} /
Key words
speech synthesis /
unit selection /
basic components /
combinational components
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] Hun A, Black A. Unit selection in a concatenative speech synthesis system using a large speech database[C]//Proceedings of the ICASSP 1996, Vol. 1, 1996:373-376.
[2] Chu M, Peng H, Yang H, et al. Selection non-uniform units from a very large corpus for concatenative speech synthesizer[C]//Proceedings of the ICASSP 2001, 2001:785-788.
[3] Christina L B. Large scale evaluation of corpus-based synthesizers:results and lessons from the blizzard challenge 2005[C]//Proceedings of the Interspeech 2005.
[4] Rutten P, Aylett M, Fackrell J, et al. A statistically motivated database pruning technique for unit selection synthesis[C]//Proceedings of the ICSLP2002. Denver, 2002:125-128.
[5] 胡郁, 凌震华, 戴礼荣. 基于声学统计建模的语音合成研究[J]. 中文信息学报, 2011, 25(6):127-135.
[6] 张巍, 吴晓如, 赵志伟, 等. 基于虚拟不定长的语音库裁剪方法[J]. 软件学报, 2006, 17(5):983-990.
[7] 章森, 刘磊, 刁麓弘. 大规模语音语料库及其在TTS中应用的几个问题[J]. 计算机学报, 2010, 33(4):687-696.
[8] 李永宏, 于洪志. 安多藏语语音合成语料库设计[J]. 西北民族大学学报, 2006, 27(1):36-39.
[9] 杨阳蕊, 李永宏, 于洪志. 基于半音节的藏语连续语音语料库设计[C]//第十届全国人机语音通讯学术会议论文集, 2009.
[10] 江荻, 龙从军. 藏文字符研究[M]. 北京:社会科学院文献出版社, 2010.
[11] 色多五世罗桑崔臣嘉措. 藏文文法根本颂色多氏大疏[M]. 北京:民族出版社, 2007.
[12] 蔡莲红, 崔丹丹, 蔡锐. 汉语普通话合成语料库TH_Coss的建设与分析[J]. 中文信息学报, 2007, 21(3):94-99.
[13] 张大军, 陈肇雄, 黄河燕. 汉语文语转换系统地址映射算法的设计与实现[J]. 软件学报, 2002, 13(1):105-110.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
国家自然科学基金(61262051,61163018);国家社科基金(16BYY167,15BYY167,14BYY132,13BYY141);教育部“春晖计划”(Z2016077);青海省基础研究项目(2017-ZJ-767)
{{custom_fund}}