引用本文:
单永明. 一类规范文本篇章结构的自动标引[J]. 中文信息学报, 1998, 12(4): 48-53.
Shan Yong - ming. Automatic Writings - Structure Indexing for Regular Chinese Text. , 1998, 12(4): 48-53.
一类规范文本篇章结构的自动标引
单永明
山西大学计算机科学系 太原 030006
Automatic Writings - Structure Indexing for Regular Chinese Text
Shan Yong - ming
Department of computer science ,Shanxi university. Taiyuan 030006
摘要 本文通过对汉语文本中标题和段的级、标题的型等概念的描述与分析,讨论了汉语文本篇章结构的标引问题,提出了规范文本的概念,并给出了规范文本篇章结构的一种标记方法,在此基础上,讨论并实现了规范文本篇章结构的自动标引,给出了标引算法。
关键词 :
中文信息处理 ,
文本自动分析 ,
自动标引 ,
篇章结构 ,
标引算法
Abstract :By the definitions and descriptions of the notions ,that the level of title and paragraph ,the type of title in chinese text ,that indexing the writings - st ructure of chinese text is discussed in this paper. The concept of the regular chinese text and a tagging method on it s writings- structure are defined. On this basis ,an implementation technique and algorithm about automatic indexing for regular chinese text writings - st ructure are presented.
Key words :
chinese information process
automatic analysis of texts
antomatic indexing
writings - st ructure
indexing algorithm.
1 、王永成 中文信息处理技术及其基础,上海交通大学出版社,1991 ,pp115 - 133 2 、储荷婷 索引工作自动化:自动标引的主要方法,情报学报,1993 ,12 (3) ,pp218 - 229 3 、苏新宁 汉语文献自动标引综析,情报学报,1993 ,12 (4) ,pp309 - 318 4 、王建波 王开铸,自然语言篇章理解及基于理解的自动文摘研究,中文信息学报,1992 ,6 (2) ,pp1 - 7
[1]
冯文贺;郭海芳;李玉静;任 函. 《世说新语》的篇章连接词 [J]. 中文信息学报, 2017, 31(1): 212-220.
[2]
才智杰,才让卓玛,. 藏文字形结构分布研究 [J]. 中文信息学报, 2016, 30(4): 98-105.
[3]
黄岚,杜友福. 一种基于维基百科的中文词语相关度学习算法 [J]. 中文信息学报, 2016, 30(3): 36-45.
[4]
才智杰, 才让卓玛,. 藏文字符的向量模型及构件特征分析 [J]. 中文信息学报, 2016, 30(2): 202-206.
[5]
郝秀兰,许方曲,蒋云良. 一种中文伪评论语料半自动获取方法 [J]. 中文信息学报, 2016, 30(1): 190-198.
[6]
吕国英,苏 娜,李 茹,王智强,柴清华. 基于框架的汉语篇章结构生成和篇章关系识别 [J]. 中文信息学报, 2015, 29(6): 98-109.
[7]
赵维纳,李 琳,刘汇丹,普布顿珠, 吴 健. 藏语三音动词短语自动抽取研究 [J]. 中文信息学报, 2015, 29(3): 196-200.
[8]
刘汇丹,诺明花,马龙龙,吴 健,贺也平. Web藏文文本资源挖掘与利用研究 [J]. 中文信息学报, 2015, 29(1): 170-177.
[9]
吴佐衍,王 宇. 基于HNC理论的词语相似度计算 [J]. 中文信息学报, 2014, 28(2): 37-43.
[10]
彭炜明,宋继华,俞士汶. 中文信息处理的词法问题——以句本位语法图解树库构建为背景 [J]. 中文信息学报, 2014, 28(2): 1-7.
[11]
孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔·斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根·依布拉音,刘群,刘知远. 语言计算的重要国际前沿 [J]. 中文信息学报, 2014, 28(1): 1-8.
[12]
庞宁,杨尔弘. 多种语义特征在突发事件新闻中的共指消解研究 [J]. 中文信息学报, 2014, 28(1): 26-32.
[13]
冯文贺. 汉英篇章结构平行语料库的对齐标注研究 [J]. 中文信息学报, 2013, 27(6): 158-165.
[14]
李业刚1,2,黄河燕1. 汉语组块分析研究综述 [J]. 中文信息学报, 2013, 27(3): 1-9.
[15]
米日姑·肉孜,吐尔根·依布拉音,麦热哈巴·艾力. 维吾尔文智能输入法研究 [J]. 中文信息学报, 2013, 27(2): 98-103.