一种基于情感依存元组的简单句情感判别方法

周 文;欧阳纯萍;阳小华;刘志明;张书卿;饶 婕

PDF(1769 KB)
PDF(1769 KB)
中文信息学报 ›› 2017, Vol. 31 ›› Issue (3) : 177-183.
情感分析与社会计算

一种基于情感依存元组的简单句情感判别方法

  • 周 文1;2;欧阳纯萍1;阳小华1;刘志明1;张书卿1;饶 婕1
作者信息 +

A Simple-sentence Sentiment Classification Method Based onEmotional Dependency Tuples

  • ZHOU Wen1;2; OUYANG Chunping1; YANG Xiaohua1; LIU Zhiming1; ZHANG Shuqing1; RAO Jie1
Author information +
History +

摘要

基于依存句法“动词配价”原理与组块的概念,提出以情感依存元组(EDT)作为中文情感表达的基本单位。它以句中能承载情感的几类实词作为中心词,修饰词依附于中心词,程度词和否定词依附于中心词和修饰词。该文对句子进行句法分析,在句法树和依赖关系中按规则提取情感依存元组,建立简单句情感依存元组判别模型计算情感倾向性。针对COAE2014评测公布的网络新闻语料,将该方法分别与有监督分类算法(KNN、SVM)和半监督算法(K-means)进行实验对比。结果表明,基于EDT的情感分类性能与有监督的机器学习算法相当,远高于半监督的聚类算法。

Abstract

Based on the principle of “Verb Valency” and the dependency parsing, this paper proposes to treat the emotional dependency tuple (EDT) as the basic unit of Chinese emotional expression. An EDT consists of the core words (i.e. several selected categories of contents words expressing emotion in the sentence), the modifier attached to the core words, and the degree or negative words attached to either the core words or the modifiers. The EDTs are extracted from the parsed sentences, and the emotional dependency tuples based sentiment classification model is established. Experimented on the web news corpus released by COAE2014, the proposed method outperforms the semi-supervised algorithm(K-MEANS), producing comparable results to the supervised classification algorithms(KNN,SVM).

关键词

情感依存元组 / 情感倾向性 / 依存语法 / 句法分析

Key words

emotional dependency tuple / emotional tendencies / dependency syntax / parsing

引用本文

导出引用
周 文;欧阳纯萍;阳小华;刘志明;张书卿;饶 婕. 一种基于情感依存元组的简单句情感判别方法. 中文信息学报. 2017, 31(3): 177-183
ZHOU Wen; OUYANG Chunping; YANG Xiaohua; LIU Zhiming; ZHANG Shuqing; RAO Jie. A Simple-sentence Sentiment Classification Method Based onEmotional Dependency Tuples. Journal of Chinese Information Processing. 2017, 31(3): 177-183

参考文献

[1] 赵妍妍, 秦兵, 刘挺.文本情感分析[J].软件学报, 2010, 21(8): 1834-1848.
[2] 周立柱, 贺宇凯, 王建勇. 情感分析研究综述[J].计算机应用,2008,28(11): 2725-2728.
[3] 贾焰, 王永恒, 杨树强.基于本体论的文本挖掘技术综述[J].计算机应用,2006,26(9): 2013-2015.
[4] 李业刚, 黄河燕.汉语组块分析研究综述[J].中文信息学报,2013(3): 1-8.
[5] 吴伟成, 周俊生, 曲维光. 基于统计学习模型的句法分析方法综述[J].中文信息学报,2013(3): 9-19.
[6] Zhou M. A block-based robust dependency parser for unrestricted Chinese text [C]//Proceedings of 2nd Chinese Language Processing Work shop, ACL. 2000: 224-30.
[7] 罗强, 奚建清. 一种结合SVM学习的产生式依存分析方法[J]. 中文信息学报,2007,21(4), 21-26。
[8] 张莉, 钱玲飞, 许鑫. 基于核心句及句法关系的评价对象抽取[J].中文信息学报,2011,25(3): 23-29.
[9] 刘挺, 马金山. 汉语自动句法分析的理论与方法[J]. 中文信息学报,2009,11(2),100-112.
[10] 孙宏林, 俞士汶. 浅层句法分析方法概述[J].当代语言学,2000,2(2)74-83.
[11] Berwiek R, Abney S , Carol T, eds. Principle-based parsing[M]. Dordrecnt: Kluwer Academic Publishers, 1991: 257-278.
[12] 李素建, 刘群, 白硕. 统计和规则相结合的汉语组块分析[J]. 计算机研究与发展,2002,39(4): 385-391.
[13] 孙广路. 基于词聚类特征的统计中文组块分析模型[J].电子学报,2008,36(12): 2450-2454.
[14] 张昱琪, 周强. 汉语基本短语的自动识别[J].中文信息学报,2002,16(6): 1-8.
[15] 肖宇, 于剑. 基于近邻传播算法的半监督聚类[J]. 软件学报,2008, 19(11): 2803-2813.
[16] 欧阳纯萍, 阳小华, 雷龙艳. 多策略中文微博细粒度情绪分析研究[J]. 北京大学学报(自然科学版), 2014,50(1): 67-72.
[17] 谢丽星, 周明, 孙茂松. 基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1): 73-83.

基金

国家自然科学基金(61402220);湖南省自然科学基金(13JJ4076);湖南省教育厅优秀青年项目(13B101);南华大学重点学科和创新团队建设基金项目
PDF(1769 KB)

507

Accesses

0

Citation

Detail

段落导航
相关文章

/