本文通过对汉语文本中标题和段的级、标题的型等概念的描述与分析,讨论了汉语文本篇章结构的标引问题,提出了规范文本的概念,并给出了规范文本篇章结构的一种标记方法,在此基础上,讨论并实现了规范文本篇章结构的自动标引,给出了标引算法。
Abstract
By the definitions and descriptions of the notions ,that the level of title and paragraph ,the type of title in chinese text ,that indexing the writings - st ructure of chinese text is discussed in this paper. The concept of the regular chinese text and a tagging method on it s writings- structure are defined. On this basis ,an implementation technique and algorithm about automatic indexing for regular chinese text writings - st ructure are presented.
关键词
中文信息处理 /
文本自动分析 /
自动标引 /
篇章结构 /
标引算法
{{custom_keyword}} /
Key words
chinese information process /
automatic analysis of texts /
antomatic indexing /
writings - st ructure /
indexing algorithm.
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
1 、王永成 中文信息处理技术及其基础,上海交通大学出版社,1991 ,pp115 - 133
2 、储荷婷 索引工作自动化:自动标引的主要方法,情报学报,1993 ,12 (3) ,pp218 - 229
3 、苏新宁 汉语文献自动标引综析,情报学报,1993 ,12 (4) ,pp309 - 318
4 、王建波 王开铸,自然语言篇章理解及基于理解的自动文摘研究,中文信息学报,1992 ,6 (2) ,pp1 - 7
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}