面向信息内容安全的文本过滤模型研究

刘梅彦,黄改娟

PDF(1404 KB)
PDF(1404 KB)
中文信息学报 ›› 2017, Vol. 31 ›› Issue (2) : 126-131.
信息抽取与文本挖掘

面向信息内容安全的文本过滤模型研究

  • 刘梅彦,黄改娟
作者信息 +

Research on Harmful Text Filtering Model Based on Semantic Analysis

  • LIU Meiyan, HUANG Gaijuan
Author information +
History +

摘要

该文设计了一种面向信息内容安全的不良文本信息过滤模型。该模型采用主题信息过滤和倾向性过滤两级过滤模式,以语句为基本处理单元,采用依存句法获取语句的语义框架,结合基于知网的词汇褒贬倾向性判别,识别文本中的不良信息并予以过滤。实验表明,该模型能够较好地提高文本过滤效率和准确率。

Abstract

In this paper, we designed a content security orieuted filtering model. This model adopts two-tier filtering mode, and the first tier is a subject-based text filtering, and the second tier is a tendency text filtering for the relevant texts. With sentence as the basic processing unit, This model adopts dependency parsing to get the semantic framework. By combination with the semantic orientation based on HowNet with the semantic framework, the harmful information can be identified and filtered at a better accuracy and efficiency.

关键词

文本信息过滤 / 不良文本 / 语义分析 / 依存句法分析

Key words

text information filtering / content security / semantic analysis / dependency parsing

引用本文

导出引用
刘梅彦,黄改娟. 面向信息内容安全的文本过滤模型研究. 中文信息学报. 2017, 31(2): 126-131
LIU Meiyan, HUANG Gaijuan. Research on Harmful Text Filtering Model Based on Semantic Analysis. Journal of Chinese Information Processing. 2017, 31(2): 126-131

参考文献

[1] 网络不良与垃圾信息举报受理中心. 网络不良与垃圾信息、举报受理情况月报[EB/OL]. [2014\
[02]. http://www.12321.cn/.
[2] 刘永丹,曾海泉,李荣陆,等.基于语义分析的倾向性文本过滤[J].通讯学报,2004,25(7): 78-85.
[3] 吕滨,雷国华,于燕飞,等.基于语义分析的网络不良信息过滤系统研究[J]. 计算机应用与软件,2010,27(2): 283-285.
[4] 王铁套,王国营,陈越,等.基于语义模式与词汇情感倾向的舆情态势研究[J].计算机工程与设计,2012,23(1): 74-77.
[5] 张紫琼.面向中文情感分析的词类组合模式研究[D],哈尔滨工业大学硕士学位论文,2007.
[6] 赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8): 1834-1848.
[7] 闻彬,何婷,罗乐,等.基于语义理解的文本情感分类方法研究[J].计算机科学,2010,20(1): 261-264.
[8] 朱嫣岚.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1): 14-20.
[9] 冯时,付永陈,阳峰,等.基于依存句法的博文情感倾向分析研究[J].计算机研究与发展,2012, 49(11): 2395-2406.
[10] 姚天昉,娄德成.汉语语句主题语义倾向分析方法的研究[J].中文信息学报,2007,21(5): 73-79.
[11] ICTCLAS.ICTCLASs HomePage[EB/OL]. http://ictclas.nlpir.org/,2014.

基金

国家自然科学基金(61070119,61370139);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519);北京市教委专项(PXM2013_014224_000042,PXM2014_014224_000067)
PDF(1404 KB)

Accesses

Citation

Detail

段落导航
相关文章

/