%0 Journal Article %A 吐尔地·托合提 %A 艾克白尔·帕塔尔 %A 艾斯卡尔·艾木都拉 %T 语义词特征提取及其在维吾尔文文本分类中的应用 %D 2014 %R %J 中文信息学报 %P 140-144 %V 28 %N 4 %X 基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性。该文使用另外一种维吾尔文自动分词方法dme-TS。dme-TS中,不再以词间空格作为切分标记提取词特征,而是用一种组合统计量(dme)来度量文本中相邻单词之间的关联程度,并以dme度量的弱关联的词间位置作为切分点,提取对学习算法真正有意义的语义词特征。实验结果表明,用dme-TS提取文本特征可以降低特征空间的维度,同时也能有效的提高传统以单词为特征的分类算法的性能。 %U http://jcip.cipsc.org.cn/CN/abstract/article_179.shtml