应用二叉树剪枝识别韵律短语边界

荀恩东,钱揖丽,郭庆,宋柔

PDF(314 KB)
PDF(314 KB)
中文信息学报 ›› 2006, Vol. 20 ›› Issue (3) : 3-7,30.

应用二叉树剪枝识别韵律短语边界

  • 荀恩东1,钱揖丽1,郭庆2,宋柔1
作者信息 +

Using Binary Tree as Pruning Strategy to Identify Prosodic Phrase Breaks

  • XUN En-dong1,QIAN Yi-li1,GUO Qing2,SONG Rou1
Author information +
History +

摘要

句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应用二叉树剪枝识别句子的韵律短语。实验结果表明,在搜索算法中,利用二叉树进行剪枝,可以很大程度上提高语音停顿预测的正确率和召回率,基于试验数据的f-Score提高了近35%。

Abstract

It is important to recognize the prosodic phrase breaks in text-to-speech. In this paper, a new method is introduced for this purpose,which uses binary tree as pruning strategy in the Maximal Entropy Model (MaxEnt) framework. First of all, the concep t of binary tree generated from a statistical language model is given. Then the process of generating the binary tree is discussed. In the process of applying MaxEnt to seeking optimal prosodic phrases, the binary tree is exploited so as to narrow the search space and improve the performance. Experimental results show that the F-score of predicating prosodic phrase breaks is about 35% better than the previous system, in which the binary tree strategy is not adopted.

关键词

人工智能 / 自然语言处理 / 统计语言模型 / 二叉树 / 韵律短语 / 最大熵

Key words

artificial intelligence / natural language processing / statistical language model / binary tree / prosodic phrase / Maximal Entropy Model

引用本文

导出引用
荀恩东,钱揖丽,郭庆,宋柔. 应用二叉树剪枝识别韵律短语边界. 中文信息学报. 2006, 20(3): 3-7,30
XUN En-dong,QIAN Yi-li,GUO Qing,SONG Rou. Using Binary Tree as Pruning Strategy to Identify Prosodic Phrase Breaks. Journal of Chinese Information Processing. 2006, 20(3): 3-7,30

参考文献

[1] 赵晟,陶建华,蔡莲红. 基于规则学习的韵律结构预测[J]. 中文信息学报, 2002, 16 (5) : 30 - 37.
[2] 牛正雨,柴佩琪. 基于边界点词性特征统计的韵律短语切分[J]. 中文信息学报, 2001, 15 (5) : 19 - 25.
[3] 应宏,蔡莲红. 基于结构助词驱动韵律短语界定的研究[J]. 中文信息学报, 1999, 13 (6) : 41 - 46.
[4] 曹剑芬. 基于语法信息的汉语韵律结构预测[J]. 中文信息学报, 2003, 17 (3) : 41 - 46.
[5] 李剑锋,胡国平,王仁华. 基于最大熵模型的韵律短语边界预测[J]. 中文信息学报, 2004, 18 (5) : 56 - 63.
[6] 叶竹钧. 朗读中的停顿探析[J]. 语文教学通讯, 1995, (Zl) : 78 - 79, 1995, (7) : 30 - 31.
[7] 汪国胜. 标点符号概说[J]. 高等函授学报(哲学社会科学版) , 1996, (6) : 19 - 23.
[8] 中华人民共和国国标《标点符号用法》, 1996, 6.
[9] Min Chu, Yao Qian ,Locating Boundaries for Prosodic Constituents in Unrestricted Mandarin Texts[J] , 2001, Computational Linguistics and Chinese Language processing, Vol 6, No. 1, 61 - 83.
[10] 赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋. 汉语文语转换系统中停顿指数的自动标注[J]. 中文信息学报, 2004, 18 (5) : 48 - 55.
[11] 聂鑫,王作英. 汉语语句中短语间停顿的自动预测方法[J]. 中文信息学报, 2003, 17 (4) : 39 - 44.
[12] 吴志勇,蔡莲红. 语音合成中韵律关联模型[J]. 中文信息学报, 2004, 18 (2) : 44 - 50.

基金

国家自然科学基金资助项目(60573184)
PDF(314 KB)

635

Accesses

0

Citation

Detail

段落导航
相关文章

/