基于树剪枝的典籍文本快速切分方法研究
——以《茶经》的翻译为例

姜 欣1 ,姜 怡 1 ,方 淼2 ,汪榕培1

PDF(986 KB)
PDF(986 KB)
中文信息学报 ›› 2010, Vol. 24 ›› Issue (6) : 10-14.
综述

基于树剪枝的典籍文本快速切分方法研究
——以《茶经》的翻译为例

  • 姜 欣1 ,姜 怡 1 ,方 淼2 ,汪榕培1
作者信息 +

Tree Pruning Based Fast Segmentation of Classical Texts
——A Case Study on “Classic of Tea”

  • JIANG Xin 1, JIANG Yi 1, FANG Miao 2, WANG Rongpei1
Author information +
History +

摘要

以《茶经》的翻译为例,基于树剪枝理论提出了一种典籍文本快速切分方法。首先,采用似然比统计量计算两字、三字甚至多字候选单元;然后在此基础上基于树剪枝的思想构建了典籍文本快速切分的模型算法,并构建了基本流程图;最后,以《茶经》为例验证了本算法的有效性和合理性。理论分析和算例表明,该算法能有效地对典籍文本进行自动切分,并简化了计算时间的复杂度,在推广中国典籍的对外传译方面具有良好的应用前景。

Abstract

This study proposes a new fast segmentation method for classic Chinese texts based on the tree pruning process. Firstly, word candidates of two, three and multiple characters are selected with likelihood ratio statistics. Then an algorithm of fast segment is presented and a basic flow chart is illustrated. Finally, the Classic of Tea is used to verify its validity and effectiveness. The theoretical analysis and experimental instances show that the algorithm is effective and promising in computer-aided translation of classic Chinese texts.
Key wordssegmentation; tree pruning; likelihood ratio; The Classic of Tea; computer-aided translation

关键词

切分 / 树剪枝 / 似然比 / 茶典籍 / 机辅翻译

Key words

segmentation / tree pruning / likelihood ratio / The Classic of Tea / computer-aided translation
 
/   /   /
 
/   /   /
 
/   /  

引用本文

导出引用
姜 欣1 ,姜 怡 1 ,方 淼2 ,汪榕培1. 基于树剪枝的典籍文本快速切分方法研究
——以《茶经》的翻译为例. 中文信息学报. 2010, 24(6): 10-14
JIANG Xin 1, JIANG Yi 1, FANG Miao 2, WANG Rongpei1. Tree Pruning Based Fast Segmentation of Classical Texts
——A Case Study on “Classic of Tea”. Journal of Chinese Information Processing. 2010, 24(6): 10-14

基金

国家自然科学基金资助项目(60673039);辽宁省教育厅2009年度高等学校科研项目计划资助项目(2009A139);大连理工大学2008人文社科研究基金资助项目(DUTHS2008320)
PDF(986 KB)

516

Accesses

0

Citation

Detail

段落导航
相关文章

/