本文探讨了各种从中文文本中抽取特征信息的区域和技术。本文以新闻语料、科技论文、公文类文献为例,详细论述了从各类文本中抽取特征信息的区域与技术,对科技论文,还给出了一些可操作的产生式规则。无论对自动标引、自动分类,还是自动文摘的研究者而言,本文的方法与结论都有一定的参考价值。
Abstract
This article discussed different kinds areas and techniques of signature information ext raction f rom Chinese text . with examples of news corpura ,scientific papers and document s ,it analysed areas and techniques of signature information ext raction f rom these text sand set some applicable production rules for scientific papers. The method and conclusion in this article are referernce for researchers on automatic indexing of texts ,automatic classification oftext s and automatic abst raction of texts.
关键词
中文文本 /
特征信息 /
文献自动化 /
公文文档
{{custom_keyword}} /
Key words
Chinese text /
signature information /
document automatic /
document
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1 ]Mark T Maybarg(1995) . Generating summaries from Event Date.《Information Processing & Management》Vo1. 31. No. 5 ,PP. 735 - 751 ,1995.
[2 ] Ronaid Brandow , Karl Mitze & Lisa F. Rall (1995) . Automatic condensation of electronic publications by sentence selection.《Information Processing & Management》Vo1. 31. No. 5 ,PP. 675 - 686 ,1995.
[3 ]刘开瑛、薛翠芳,计算机期刊关键词标引统计分析技术报告。1996 年10 月(内部资料) 。
[4 ]靳从等 ,主题词自动标引中的知识处理方法《, 情报理论与实践》1996 年第 2 期 ,30 - 33。
[5 ]刘开瑛、王秉荣、刘静,中国人民银行××省分行《重要文件汇编》的主题词标引研究技术报告。1996 年3 月(内部资料)
[6 ] Gerard SAL Ton ,James Allan & AMIT singhal. (1996) . Automatic text Decomposition and structuring.《Information Processing & Management》Vo1. 32. No. 2 ,PP. 127 - 138 ,1996
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}