%0 Journal Article %A 吐尔地·托合提 %A 维尼拉·木沙江 %A 艾斯卡尔·艾木都拉 %T 基于语义串抽取及主题相似度度量的维吾尔文文本分类 %D 2017 %R %J 中文信息学报 %P 100-107 %V 31 %N 4 %X 该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能。 %U http://jcip.cipsc.org.cn/CN/abstract/article_2421.shtml