引用本文:
孙成立,刘刚,郭军. 中文语音确认中子词置信度性能的研究[J]. 中文信息学报, 2008, 22(2): 106-109,128.
SUN Cheng-li , LIU Gang, GUO Jun. Investigation of Subwords Confidence Performance in Chinese Speech Verification . , 2008, 22(2): 106-109,128.
中文语音确认中子词置信度性能的研究
孙成立1,2 ,刘刚1 ,郭军1
1. 北京邮电大学 信息工程学院, 北京 100876; 2. 石家庄经济学院 信息工程学院, 河北 石家庄050031
Investigation of Subwords Confidence Performance in Chinese Speech Verification
SUN Cheng-li 1,2 , LIU Gang1 , GUO Jun1
1.School of Information Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China; 2. School of Information Engineering, Shijiazhuang University of Economics, Shijiazhuang,Hebei 050031, China
摘要 本文提出了一种基于最小分类错误准则(MCE)的子词权重参数估计算法,通过MCE训练得到子词的权重系数。子词对词级置信度贡献量的研究表明: 韵母的确认能力显著好于声母,在置信性能方面比声母更加稳定和可靠,区分能力优于声母。在130个关键词的关键词检测系统实验表明,采用不同子词贡献权重比等贡献权重时等错误率下降3.05%。
关键词 :
计算机应用 ,
中文信息处理 ,
语音确认 ,
置信度 ,
似然比检验 ,
最小分类错误
Abstract :A Minimum Classification Error (MCE) criterion based sub-words weighting parameters estimation algorithm is proposed in which the sub-word weighting parameters are derived by the MCE training. Investigation of the contribution of different sub-words on the word-level confidence measure show that Finals significantly outperform the Initials with more reliability and stability in confidence performance, and Finals have more discriminative power than those of Initials. Experiment on keyword spotting system with 130 keywords shows that the system with different sub-word weighting contribution achieved a relative Equal Error Rate (EER) reduction of 3.05% compared with the equal weighting contribution case.
Key words :
: computer application
Chinese information processing
utterance verification
confidence measure
likelihood ratio test
MCE
收稿日期: 2007-05-30
基金资助: : 国家863计划资助项目(2006AA010102);河北省科技厅资助项目(052135147, 042135105);河北省教育厅资助项目(2005340)
作者简介 : 孙成立(1975—),男,博士生,主要研究方向为语音识别;刘刚(1974—), 男,副教授,主要研究方向为语音识别;郭军(1959—),男,教授,主要研究方向为模式识别、信息检索。
[1] Chase Lin, Error-Responsive Feedback Mechanisms for Speech Recognition. Ph.D. Thesis [D]. California,Carnegie Mellon University. April 1997. [2] F. Wessel, R. Schluter, K. Macherey. Confidence measures for large vocabulary continuous speech recognition[A]. Proceeding of ICASSP[C]. 2001. 9(3): 288-298. [3] E. Lleida, R.-C. Rose. Utterance verification in continuous speech recognition: decoding and training procedures [A]. Proceeding of ICASSP[C]. 2000. 8:126-139. [4] R. Sukkar, C.-H. Lee. Vocabulary Independent Discriminative Utterance Verification for Non-keyword Rejection in Sub-word Based Speech Recognition [A]. Proceeding of ICASSP[C]. 1996. 4:420-429. [5] G. Bouwman, L. Boves, J. Koolwaaij. Weighting phone confidence measures for automatic speech recognition[A]. Proc. COST Action 249 [C]. Ghent, Belgium. IEEE Press. 2000. 59-62. [6] S. Abdou, M.-S. Scordilis. Beam search pruning in speech recognition using a posterior probability-based confidence measure[J]. Speech Communication, 2004, 42: 409-428. [7] B.-H Juang, S. Katagiri. Discriminative learning for minimum error classification [J]. IEEE Transactions on Signal Processing. 1992, 40(12): 3043-3054. [8] 李净,郑方, 张继勇. 汉语连续语音识别中上下文相关的声母建模[J].清华大学学报, 2004, 44(1):61-64. [9] 张家 . 汉语普通话区别特征系统树状图[J]. 声学学报, 2006, 31(3):193-198.
[1]
才智杰,才让卓玛,. 藏文字形结构分布研究 [J]. 中文信息学报, 2016, 30(4): 98-105.
[2]
黄岚,杜友福. 一种基于维基百科的中文词语相关度学习算法 [J]. 中文信息学报, 2016, 30(3): 36-45.
[3]
林海伦,熊锦华,王 博,程学旗. 基于领域知识抽样的深网资源采集方法 [J]. 中文信息学报, 2016, 30(2): 175-181.
[4]
才智杰, 才让卓玛,. 藏文字符的向量模型及构件特征分析 [J]. 中文信息学报, 2016, 30(2): 202-206.
[5]
飞 龙,高光来,王宏伟. 基于词干的蒙古语语音关键词检测方法的研究 [J]. 中文信息学报, 2016, 30(1): 124-129.
[6]
郝秀兰,许方曲,蒋云良. 一种中文伪评论语料半自动获取方法 [J]. 中文信息学报, 2016, 30(1): 190-198.
[7]
赵维纳,李 琳,刘汇丹,普布顿珠, 吴 健. 藏语三音动词短语自动抽取研究 [J]. 中文信息学报, 2015, 29(3): 196-200.
[8]
刘汇丹,诺明花,马龙龙,吴 健,贺也平. Web藏文文本资源挖掘与利用研究 [J]. 中文信息学报, 2015, 29(1): 170-177.
[9]
吴佐衍,王 宇. 基于HNC理论的词语相似度计算 [J]. 中文信息学报, 2014, 28(2): 37-43.
[10]
彭炜明,宋继华,俞士汶. 中文信息处理的词法问题——以句本位语法图解树库构建为背景 [J]. 中文信息学报, 2014, 28(2): 1-7.
[11]
孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔·斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根·依布拉音,刘群,刘知远. 语言计算的重要国际前沿 [J]. 中文信息学报, 2014, 28(1): 1-8.
[12]
庞宁,杨尔弘. 多种语义特征在突发事件新闻中的共指消解研究 [J]. 中文信息学报, 2014, 28(1): 26-32.
[13]
李业刚1,2,黄河燕1. 汉语组块分析研究综述 [J]. 中文信息学报, 2013, 27(3): 1-9.
[14]
黄石磊1, 2,刘 轶2,程 刚2. 基于输出概率分布的集外词拒绝 [J]. 中文信息学报, 2013, 27(3): 56-61.
[15]
米日姑·肉孜,吐尔根·依布拉音,麦热哈巴·艾力. 维吾尔文智能输入法研究 [J]. 中文信息学报, 2013, 27(2): 98-103.