智能Web中文主题信息收集系统IRobot的设计

马亮,陈群秀,王俊,徐国伟

PDF(506 KB)
PDF(506 KB)
中文信息学报 ›› 2002, Vol. 16 ›› Issue (5) : 25-31.

智能Web中文主题信息收集系统IRobot的设计

  • 马亮1,陈群秀1,王俊2,徐国伟2
作者信息 +
History +

摘要

本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性, 系统采用了对待收集URL进行相关度预测为主, 对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中, 深入考虑了Web主题信息结构和组织特性的多种因素, 综合提高了系统的性能。相比已有的研究, 系统的精度和收集效率更高, 且更为稳定, 并能够自动获得主题领域内重要资源的列表。

关键词

信息检索 / 主题信息收集 / 相关度预测 / 相关度评价 / 中文信息处理

引用本文

导出引用
马亮,陈群秀,王俊,徐国伟. 智能Web中文主题信息收集系统IRobot的设计. 中文信息学报. 2002, 16(5): 25-31
PDF(506 KB)

590

Accesses

0

Citation

Detail

段落导航
相关文章

/