中文比较句识别及比较关系抽取

宋锐,林鸿飞,常富洋

PDF(484 KB)
PDF(484 KB)
中文信息学报 ›› 2009, Vol. 23 ›› Issue (2) : 102-107.
综述

中文比较句识别及比较关系抽取

  • 宋锐,林鸿飞,常富洋
作者信息 +

Chinese Comparative Sentences Identification and Comparative Relations Extraction

  • SONG Rui, LIN Hong-fei, CHANG Fu-yang
Author information +
History +

摘要

比较是一种具有一定说服力的评估方式,利用机器进行比较句的识别以及比较关系的抽取可以对观点挖掘、信息推荐等应用提供重要的依据。该文通过构建中文比较模式库以实现中文比较句的自动识别。在此基础上,该文通过选取比较主体、比较客体及其上下文的词、词性、位置、语义以及比较属性的领域知识等特征,利用条件随机域模型进行中文比较关系抽取。实验结果表明,中文比较模式库的构建有助于比较句的自动识别,而在词、词性、位置等Baseline特征中融入语义、领域知识及启发式规则特征后,基于条件随机域的比较关系抽取结果有了显著的提高。

Abstract

Automatic comparative sentences identification and comparative relations extraction contribute to opinion mining and information recommendation. This paper constructs a Chinese Comparative Pattern Database to identify comparative sentences. Moreover, several types of features are chosen to establish a Condition Random Field (CRF) model for the comparative relations extraction. Experiment shows the Chinese Comparative Pattern Database contributes to the identification of comparative sentences, and the proposed types of feature set are valid to improve the result of comparative relation extraction by CRF model.

关键词

计算机应用 / 中文信息处理 / 中文比较句识别 / 比较关系抽取 / 中文比较模式库 / 条件随机域

Key words

computer application / Chinese information processing / Chinese comparative sentences identification / comparative relations extraction / Chinese comparative pattern database / CRF

引用本文

导出引用
宋锐,林鸿飞,常富洋. 中文比较句识别及比较关系抽取. 中文信息学报. 2009, 23(2): 102-107
SONG Rui, LIN Hong-fei, CHANG Fu-yang. Chinese Comparative Sentences Identification and Comparative Relations Extraction. Journal of Chinese Information Processing. 2009, 23(2): 102-107

参考文献

[1] Nitin Jindal, Bing Liu. Identifying comparative sentences in text documents[C]//Proceedings of SIGIR 2006. Washington, USA, 2006: 244-251.
[2] Nitin Jindal, Bing Liu. Mining Comparative Sentences and Relations[C]//Proceedings of AAAI 2006. Boston, USA, 2006.
[3] 尚平. 比较句系统研究综述[J].语言文字应用, 2006,(S2): 77-80.
[4] 陈珺,周小兵. 比较句语法项目的选取和排序[J].语言教学与研究, 2005,(2): 22-33.
[5] 又宁. 现代汉语中两种主要的比较句的分析[J].语文研究,1995, (3): 5-10.
[6] http://pinglun.it168.com/.
[7] HIT-IRLab-同义词词林(扩展版),哈尔滨工业大学信息检索研究室: http://ir.hit.edu.cn/.
[8] 刘颖. 现代汉语中几种表示相同比较的句式[J].安徽师范大学学报(人文社会科学版),2000, 28(3): 436-440.
[9] 车竞. 现代汉语比较句论略[J].湖北师范大学学报(哲学社会科学版),2005, 25(3): 60-63.
[10] John Lafferty, Andrew McCallum, Fernando Pereira. Conditional random fields: Probabilistic models for segmenting and labeling sequence data[C]//Proceedings of ICML 2001. San Francisco, USA, 2001: 282-289.
[11] 徐琳宏, 林鸿飞, 潘宇等.情感词汇本体的构造[J].情报学报,2008,27(2): 180-185.

基金

国家自然科学基金资助项目(60373095,60673039);国家863高科技计划资助项目(2006AA01Z151);教育部留学回国人员科研启动基金项目
PDF(484 KB)

817

Accesses

0

Citation

Detail

段落导航
相关文章

/