%0 Journal Article %A 王煜 %A 王正欧 %A 白石 %T 用于文本分类的改进KNN算法 %D 2007 %R %J 中文信息学报 %P 76-82 %V 21 %N 3 %X 最近邻分类器是假定局部的类条件概率不变,而这个假定在高维特征空间中无效。因此在高维特征空间中使用k最近邻分类器,不对特征权重进行修正就会引起严重的偏差。本文采用灵敏度法,利用前馈神经网络获得初始特征权重并进行二次降维。在初始权重下,根据样本间相似度采用SS树方法将训练样本划分成若干小区域,以此寻找待分类样本的近似k0个最近邻,并根据近似k0个最近邻和Chi-square距离原理计算新权重,搜索出新的k个最近邻。此方法在付出较小时间代价的情况下,在文本分离中可获得较好的分类精度的提高。 %U http://jcip.cipsc.org.cn/CN/abstract/article_769.shtml