%0 Journal Article %A 高 松 %A 冯志伟 %T 基于依存树库的文本聚类研究 %D 2011 %R %J 中文信息学报 %P 59-64 %V 25 %N 3 %X 文本聚类是信息检索的重要内容。为了避免使用计算过程复杂的聚类算法,并能从语言学角度对聚类特征和聚类结果进行分析和解释,该文提出了采用句法分布信息进行文本聚类的方法。在汉语依存树库中,得出10种具有显著差异的词类依存关系,以其中5种依存关系作为聚类特征,访谈会话类和新闻播报类文本的相似度分别为71.98%和83.13%。实验结果验证了该方法利用依存关系对文本聚类的可行性和有效性。 %U http://jcip.cipsc.org.cn/CN/abstract/article_1483.shtml