%0 Journal Article %A 蒋 旦 %A 周文乐 %A 朱 明 %T 基于语义和图的文本聚类算法研究 %D 2016 %R %J 中文信息学报 %P 121-128 %V 30 %N 5 %X 传统的文本聚类往往采用词包模型构建文本向量,忽略了词语间丰富的语义信息。而基于中心划分的聚类算法,容易将概念相关的自然簇强制分开,不能很好地发现人们感兴趣的话题。该文针对传统文本聚类算法的缺点,提出一种基于语义和完全子图的短文本聚类算法,通过对目前主流的三大语义模型进行了实验和对比,选择了一种较为先进的语义模型,基于该语义模型进行了聚类实验,发现新算法能较好地挖掘句子的语义信息且较传统的K-means有更高的聚类纯度。
%U http://jcip.cipsc.org.cn/CN/abstract/article_2281.shtml