“语编标注与推理” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 王 荀,李素建,王宇昕
    2015, 29(3): 65-70.
    摘要 (691) PDF (4843 KB) (842)
    篇章标注是自然语言处理中的重要任务,很多其他任务,如自动摘要、机器问答等都可以通过篇章标注得到对文本内容和语义的认识,从而获得更好的结果。与此同时,篇章理解的理论如篇章修辞结构(RST),向心理论(CT)等与实际问题的结合并不紧密,难以实用。该文中我们参考现有的语言学理论和一些语篇标注库(如RST-DT,PDTB),并结合自然语言处理任务特点,提出了一套用于篇章标注的汉语标注体系。这个体系能够比较准确和全面地描述出篇章的内容和逻辑关系,并很好地服务于实际任务的需要。
  • 吴云芳,徐艺峰,王恺然
    2015, 29(3): 71-81.
    摘要 (1043) PDF (1458 KB) (830)
    句际关系自动分析属于篇章语义学研究的范畴,虽然英语句际关系的研究已有大量工作,但汉语句际关系的自动分析还只是刚刚起步。该文在RST理论框架下,结合汉语特点,提出了完整的汉语篇章级小句关系标注体系。将汉语话题和逻辑关系置于同一个框架下进行描述,将小句关系划分为事件附属关系和事件逻辑关系两大类。逻辑关系又包括6个中类、15个小类。目前已在人民日报语料上完成了8000个句子的小句关系标注。抽取出其中1000个句子检测了双盲标注的一致性,揭示了汉语意合性语言小句关系标注的困难;并基于标注数据对关系类型进行了定量分析,指示了汉语句际关系自动分析将面临的重点和难点。
  • 倪盛俭,姬东鸿
    2015, 29(3): 82-87.
    摘要 (693) PDF (709 KB) (786)
    文本蕴涵识别是大部分自然语言信息处理应用的核心。该文尝试探讨文本蕴涵识别中涉及的(意象)图式理据。通过对选自语料例子的分析,显示各类图式是如何成为文本蕴涵识别的理据的。图式包括物性结构、理想认知模型、框架、脚本等。这些图式都是表示语义信息的结构。从广义上讲它们都可以纳入语义特征的范畴,都可能成为蕴涵关系成立的理据。基于图式的文本蕴涵识别研究结合有关图式库的构建,有望为突破文本蕴涵识别瓶颈作出重要贡献。
  • 严为绒,朱珊珊,洪 宇,姚建民,朱巧明
    2015, 29(3): 88-99.
    摘要 (689) PDF (2636 KB) (956)
    篇章关系分析是一种专门针对篇章语义关系及修辞结构进行分析与处理的自然语言理解任务。隐式篇章关系分析是其中重要的研究子任务,要求在显式关联线索缺失的情况下,自动检测特定论元对之间的语义关系类别。目前,隐式篇章关系分析性能较低,主流检测方法的准确率仅约为40%。造成这一现状的主要原因是: 现有方法脱离论元的语义框架进行关系分析与检测,仅仅局限于特定论元特征的关联分析。针对这一问题,该文提出一种基于框架语义的隐式篇章关系推理方法,这一方法有效利用了框架语义知识库(即FrameNet)和相关识别技术,实现了论元语义框架的自动识别,并在此基础上,借助大规模文本数据中框架语义关联关系的分布概率,进行论元语义一级的关系判定。实验结果显示,仅仅利用第一层框架语义知识,即可提高隐式篇章关系检测性能至少5.14%;同时,在考虑关系类别平衡性的情况下,这一方法能提高至少10.68%。