基于搭配对的汉语形容词—名词聚类

闻扬,苑春法,黄昌宁

PDF(348 KB)
PDF(348 KB)
中文信息学报 ›› 2000, Vol. 14 ›› Issue (6) : 45-50.
综述

基于搭配对的汉语形容词—名词聚类

  • 闻扬,苑春法,黄昌宁
作者信息 +

Clustering Of Chinese Adjectives-Nouns Based on Compositional Pairs

  • WEN Yang,YUAN Chun-fa,HUANG Chang-ning
Author information +
History +

摘要

本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中,不同词性的词的聚类交替进行,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响,又提出了修饰度的与修正距离的概念。将此算法应用于汉语形容词- 名词的搭配对,对形容词与名词进行聚类,实验结果显示该算法是有效的。

Abstract

This paper proposes a bidirctional hierarchical clustering algorithm of simultaneous clustering words of different categories. During clustering ,the process is interactional and alternant . We construct an objective function based on Minimum Description Length (MDL) . In order to solve the problem caused by sparse data two concepts of modificatory degree and modificatory distance are proposed. The further application to clustering Chinese adjectives and nouns demonstrates the algorithm is effective.

关键词

双向分级聚类 / 搭配对 / 修饰度 / 最小描述长度

Key words

bidirectional hierarchical clustering / compositional pairs / modificatory degree / minimum description length

引用本文

导出引用
闻扬,苑春法,黄昌宁. 基于搭配对的汉语形容词—名词聚类. 中文信息学报. 2000, 14(6): 45-50
WEN Yang,YUAN Chun-fa,HUANG Chang-ning. Clustering Of Chinese Adjectives-Nouns Based on Compositional Pairs. Journal of Chinese Information Processing. 2000, 14(6): 45-50

参考文献

[1] 李涓子等. 基于组合实例的双向优化聚类. JSCL - 97 ,1997
[2] 姬东鸿、黄昌宁. 汉语形容词和名词的语义组合模型. 1996
[3] Hang Li ,Naoki Abe. Clustering Words with the MDL Principle ,cmp-lg/9605014 ,1996 ,2
[4] 许伟. 句法- 语义一体化的汉语句法分析研究[硕士学位论文] . 北京:清华大学,1997
[5] 倪文杰等. 现代汉语辞海. 北京:中国人民出版社,1994
[6] 边肇祺等. 模式识别. 北京:清华大学出版社,1997

基金

自然科学基金(69773031);国家重点基础研究973项目(G1998030507)
PDF(348 KB)

729

Accesses

0

Citation

Detail

段落导航
相关文章

/