%0 Journal Article %A 李国和 %A 岳 翔 %A 吴卫江 %A 洪云峰 %A 刘智渊 %A 程 远 %T 面向文本分类的特征词选取方法研究与改进 %D 2015 %R %J 中文信息学报 %P 120-125 %V 29 %N 4 %X 中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响。中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性能和精度。在分析、总结多种经典文本特征选取方法基础上,以文档频为主,实现文档集中的特征词频及其分布为修正的特征词选取方法(DC)。采用宏F值和微F值为评价指标,通过实验对比证明,该方法的特征选取效果好于经典文本特征选取方法。 %U http://jcip.cipsc.org.cn/CN/abstract/article_239.shtml