中文文档自动分类系统的设计与实现

邹涛,王继成,黄源,张福炎

PDF(331 KB)
PDF(331 KB)
中文信息学报 ›› 1999, Vol. 13 ›› Issue (3) : 27-33.
综述

中文文档自动分类系统的设计与实现

  • 邹涛,王继成,黄源,张福炎
作者信息 +

The Design and Implementation of an Automatic Chinese Documents Classification System

  • Zou Tao , Wang Jicheng , Huang Yuan , Zhang Fuyan
Author information +
History +

摘要

文档自动分类是信息处理领域中的一项重要研究课题。本文阐述了一个中文文档自动分类系统的设计与实现,并着重介绍了系统实现中的一些主要技术问题的处理,如文本分类模型、特征提取、词典构造等。

Abstract

Automatic document classification is an important application of text information processing technology. This paper presents the design and implementation of an automatic Chinese documents classification system. Especially , it discusses some key techniques such as text classification model , feature extraction and structure of dictionary.

关键词

文本分类 / 分类模型 / VSM / 特征提取

Key words

Text Classification / Classification Model / VSM / Feature Selection

引用本文

导出引用
邹涛,王继成,黄源,张福炎. 中文文档自动分类系统的设计与实现. 中文信息学报. 1999, 13(3): 27-33
Zou Tao , Wang Jicheng , Huang Yuan , Zhang Fuyan. The Design and Implementation of an Automatic Chinese Documents Classification System. Journal of Chinese Information Processing. 1999, 13(3): 27-33

参考文献

[1] Venkat N Gudivada. Information Retrieval on the World Wide Web. IEEE Internet Computing , 1997 , (4) :58 - 68
[2] 吴立德. 大规模中文文本处理. 上海复旦大学出版社,1997 ,7
[3] Salton G, Wong A , Yang C S. A Vector Space Model for Automatic Indexing , Communications of ACM , 1975 ,18 :613 - 620
[4] 揭春雨,刘源等. 论汉语自动分词方法. 中文信息学报,1989 ,3 (1) :1 - 9
PDF(331 KB)

Accesses

Citation

Detail

段落导航
相关文章

/