最大熵和条件随机场模型相融合的藏文人名识别

加羊吉,李亚超,宗成庆,于洪志

PDF(2186 KB)
PDF(2186 KB)
中文信息学报 ›› 2014, Vol. 28 ›› Issue (1) : 107-112.
少数民族语言信息处理

最大熵和条件随机场模型相融合的藏文人名识别

  • 加羊吉1,李亚超1,宗成庆2,于洪志1
作者信息 +

A Hybrid Approach to Tibetan Person Name Identification by Maximum Entropy Model and Conditional Random Fields

  • JIA Yangji1,LI Yachao1,ZONG Chengqing2,YU Hongzhi1
Author information +
History +

摘要

藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。

Abstract

Tibetan person name recognition is one of the most difficult tasks in the area of Tibetan information processing, with a direct impact on the precision of Tibetan word segmentation. Based on the analysis of wording rules and features of Tibetan names, this paper proposes a method combining maximum entropy and conditional random fields to identify Tibetan person names. The experiment shows that this approach works significant well reaching 93.08% in F1-measure.

关键词

藏文人名识别 / 最大熵 / 条件随机场

Key words

Tibetan name identification / maximum entropy / conditional random fields

引用本文

导出引用
加羊吉,李亚超,宗成庆,于洪志. 最大熵和条件随机场模型相融合的藏文人名识别. 中文信息学报. 2014, 28(1): 107-112
JIA Yangji,LI Yachao,ZONG Chengqing,YU Hongzhi. A Hybrid Approach to Tibetan Person Name Identification by Maximum Entropy Model and Conditional Random Fields. Journal of Chinese Information Processing. 2014, 28(1): 107-112

参考文献

[1] 王贵.藏族人名研究[M].北京: 民族出版社,1991: 20.
[2] 罗智勇,宋柔.现代汉语自动分词中专名的一体化、快速识别方法[C]//Ji Dong-Hong,国际中文电脑学术会议,新加坡, 2001: 323-328.
[3] 郑家恒,李鑫,谭红叶.基于语料库的中文姓名识别方法研究[J].中文信息学报,2000,14(1): 7-12.
[4] 宗成庆,统计自然语言处理[M].清华大学出版社,2008: 122.
[5] 李中国,刘颖.边界模板与局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5): 44-50.
[6] 张华平,刘群.基于角色标注的中国人名自动识别研究[J].计算机学报,2004,27(1): 44-50.
[7] 张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报(理学版),2009,41(2): 40-43.
[8] 毛婷婷,李丽双,黄德根.基于混合模型的中国人名自动识别[J].中文信息学报,2007,21(2): 22-28.
[9] 钱晶,张玥杰,张涛.基于最大熵的汉语人名地名研究[J].小型微型计算机系统,2006,27(9): 1701-1765.
[10] 贾宁,张全.基于最大熵模型和规则的中文姓名识别[J].计算机工程与应用,2007,43(45): 1-4.
[11] 尕藏卓玛.浅谈藏族人名的文化含义及其翻译原则[J].西北民族大学学报(哲学社会科学版),2008,5: 113-116.
[12] 罗智勇,宋柔,朱小杰.藏族人名汉译名识别研究[J].情报学报,2009,28(3): 478-480.

基金

国家自然基金重点项目(61032008);西北民族大学中央高校基本科研业务费专项资金资助项目(ycx12003);模式识别国家重点实验室开放课题(201001051)
PDF(2186 KB)

566

Accesses

0

Citation

Detail

段落导航
相关文章

/