%0 Journal Article %A 高恩婷 %A 段湘煜 %A 巢佳媛 %A 张 民 %T 翻译规则剪枝与基于半强制解码和变分贝叶斯推理的模型训练 %D 2014 %R %J 中文信息学报 %P 141-147 %V 28 %N 5 %X 统计机器翻译一般采用启发式方法训练翻译模型。但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高。针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型。该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数。该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高。 %U http://jcip.cipsc.org.cn/CN/abstract/article_149.shtml