韩国语句子结构相似度计算方法研究

毕玉德,姜博文

PDF(5241 KB)
PDF(5241 KB)
中文信息学报 ›› 2019, Vol. 33 ›› Issue (3) : 59-63,101.
民族、跨境及周边语言信息处理

韩国语句子结构相似度计算方法研究

  • 毕玉德1,2,姜博文2
作者信息 +

Research on Korean Sentence Structure Similarity Metric

  • BI Yude1,2, JIANG Bowen2
Author information +
History +

摘要

句子相似度计算是信息处理领域一项基础技术,在基于实例的机器翻译中直接影响译文质量。该文以韩国语句子为研究对象,结合韩国语的句子特点提出了一种句子结构相似度的计算方法。该方法通过先提取句子的骨架结构,然后结合韩国语的句法特点制定标记转换规则,最后用转换后的句子结构与实例库中句子匹配得到与之相似的句子,得出两个句子间的结构相似度,并且通过实验验证了该方法的可行性,提高了相似度计算效果。

Abstract

Sentence similarity computing is a fundamental task in the field of natural language processing, e.g. it directly affects the quality of translation in EBMT(Example-based Machine Translation)system. Focused on Korean, this paper puts forward a method for Korean sentence structure similarity computing according to the Korean sentence characteristics. This method first extracts the skeleton of the Korean sentence and then further processed the skeleton with the transformation rules designed in this paper. The final sentence similarity are measured in this kind of structure space, which are validated for the feasibility and efficiency by the experiment.

关键词

韩国语 / 句子结构 / 相似度

Key words

Korean / sentence structure / similarity

引用本文

导出引用
毕玉德,姜博文. 韩国语句子结构相似度计算方法研究. 中文信息学报. 2019, 33(3): 59-63,101
BI Yude, JIANG Bowen. Research on Korean Sentence Structure Similarity Metric. Journal of Chinese Information Processing. 2019, 33(3): 59-63,101

参考文献

[1] Chris H Q, et al. A similarity-based probability model for latent semantic indexing[C]//Proceedings of 22nd, ACM SIGIR Conference on Research and Development in Information Retrieval, 1999: 59-65.
[2] 晋耀红.基于语境框架的文本相似度计算[J].计算机工程与应用, 2004, 40(16): 36-39.
[3] 李彬,等.基于语义依存的汉语句子相似度研究[J].计算机应用研究, 2003, 20 (12): 15-17.
[4] 刘宏哲.一种基于本体的句子相似度计算方法[J].计算机科学, 2013, 40(1): 251-256.
[5] 王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报, 2005, 19(1): 21-29.
[6] 孙向东,赵铁军,梁华参.基于结构对齐的统计机器翻译模型[J].通信学报, 2009, 30(7): 124-129.
[7] 邓涵,等.基于句法结构与修饰词的句子相似度计算[J]. 计算机工程, 2017,43(9): 240-244.
[8] 宣德五.韩国语基础语法[M].北京: 社会科学文献出版社, 2007.
[9] 安帅飞,毕玉德.韩国语名词短语结构特征分析及自动提取[J].中文信息学报, 2013,27(5): 205-210.
PDF(5241 KB)

795

Accesses

0

Citation

Detail

段落导航
相关文章

/