情感词汇的获取是文本倾向性分析的基础。为了解决人工识别方法低效的不足,并为维吾尔语情感词的研究及情感词词典的创建提供一些可供选择的方法和思路,该文首先分析了维吾尔语情感词汇在上下文中表现的特征,并结合维吾尔语本身的语法特征,建立了扩展的维吾尔语新增特征模型,与词频逆文档频率(TF-IDF)算法相结合,实现了维吾尔语情感词汇的识别。实验结果指出该特征模型有效地提高了情感词汇的识别率。
Abstract
The sentiment vocabulary is essential for the sentiment analysis. To deal with the inefficiency of manual acquisition, this papers proposes an extension of features based on the grammar and context characteristics of Uyghur sentimental words.Combined with the TF-IDF measure, our algorithm is proved to effectively improve the recognition of sentiment words.
关键词
情感词汇 /
维吾尔语 /
语法 /
自动获取
{{custom_keyword}} /
Key words
emotional words /
Uyghur /
grammar /
automatic acquisition
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,04: 495-511.
[2] 陈建美,林鸿飞,杨志豪.基于语法的情感词汇自动获取[J].智能系统学报,2009,02: 100-106.
[3] 冯冠军,禹龙,田生伟.基于CRFs自动构建维吾尔语情感词语料库[J].现代图书情报技术,2011,03: 17-21.
[4] 王志涛,於志文,郭斌,等.基于词典和规则集的中文微博情感分析[J].计算机工程与应用,2015,08: 218-225.
[5] 年梅,范祖奎,刘若兰.维吾尔语褒贬情感词典构建研究[J].计算机工程与应用,2015,11: 1-5.
[6] 阿布都鲁甫·塔克拉玛干尼. 维吾尔语词汇学与研究[M]. 北京: 民族出版社,2011,2: 41-46.
[7] 黄俊,田生伟,禹龙,等.基于维吾尔语情感词的句子情感分析[J].计算机工程,2012,09: 183-185.
[8] 黄俊.维吾尔语文本情感分析研究[D].新疆大学硕士学位论文,2013.
[9] 热依莱木·帕尔哈提,孟祥涛,艾斯卡尔·艾木都拉.基于区分性关键词模型的维吾尔文本情感分类[J].计算机工程,2014,10: 132-136,142.[10] 罗亚伟,田生伟,禹龙等.意见挖掘中维吾尔语文本隐式情感分析[J].计算机工程与设计,2014,09: 3295-3300.
[11] 禹龙,田生伟,冯冠军.维吾尔语情感词汇自动识别[J].计算机工程,2011,07: 213-215.
[12] 周晓. 基于互联网的情感词库扩展与优化研究[J]. 东北大学信息科学与工程学院,2011,06;14-15.
[13] 力提甫·托乎提.现在维吾尔语参考语法[M]. 中国社会科学出版社,2012: 206-213.
[14] 热孜亚木·麦麦提吐逊,买提热依木·沙依提.汉语-维吾尔语副词对比研究[D].中央民族大学硕士学位论文,2012.
[15] Hatzivassiloglou V,McKeown K R. Predicting the Semantic Orientation of Adjectives[C]//Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics.1997: 174-181.
[16] 王海蓉,孙丽莉. 汉维语双重否定语形对比[J]. 塔里木大学学报,2010,01: 77-83.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}
基金
国家自然科学基金(61262066,61662081);国家社科基金(14AZD11);国家语委重点项目(ZD135-28);新疆维吾尔自治区自然科学基金(2014211A045);新疆维吾尔自治区哲学社会科学研究规划基金(14CYY093);教育部人文社会科学一般项目(14YJC740001);国家自然科学基金(61132009);国家自然科学基金(61163064);教育部人文社会科学工程科技人才培养专项(15JDGC022);2015-2016年度新疆师范大学文学院研究生创新基金(ZYW2015005);国家少数民族语言资源监测中心项目
{{custom_fund}}