“专题: 面向类人智能的教育认知关键技术” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 魏思,巩捷甫,王士进,宋巍,宋子尧
    2022, 36(4): 111-123.
    摘要 (789) PDF (3920 KB) (1527)
    利用自然语言处理技术对作文进行自动评阅是有重要意义和挑战的研究课题,引起了人工智能领域与教育领域学者的共同关注。该文聚焦于语文作文自动评分任务,提出通过深层语言分析,包括应用高性能别字、语法纠错器分析语言运用能力,采用自动修辞分析、优秀表达识别等手段反映语言表达能力,以及通过细粒度篇章质量分析评估篇章整体质量,来构建有效特征。该文同时提出了结合语言分析特征与深度神经网络编码的自适应混合评分模型。在真实语文作文数据上的实验表明,融入深层语言分析特征可有效提高作文评分效果;年级与主题自适应的模型训练策略,可提高模型的迁移能力和预测效果。消融实验进一步分析和解释了不同类型特征对评分效果的贡献。
  • 陈越,何宇豪,孙亚伟,程龚,瞿裕忠
    2022, 36(4): 124-136.
    摘要 (443) PDF (2987 KB) (638)
    如何利用人工智能技术回答标准测试题目是一项具有挑战性的任务,吸引了人工智能领域的广泛研究。该文聚焦在高中地理的因果简答题求解任务,求解因果简答题需要进行知识集成和多跳因果推理,最终生成一段长文本作为答案。为此,该文定义了抽象事理图谱(AEG)来表示因果等关系,并利用预训练语言模型从语料中自动抽取一个面向高中地理因果简答题的抽象事理图谱,实现了多源知识集成。基于抽象事理图谱,该文利用图神经网络技术来融合结构化和非结构化知识,实现了多跳因果推理。该文在包含真实的高中地理因果简答题的数据集GeoCEQA上开展实验,结果表明,无论是ROUGE、BLEU指标还是人工评价的得分,该文提出的方法都取得了最佳结果,在ROUGE指标上,相比最优基线方法提升0.8%~1.4%;在BLEU指标上,相比最优基线方法提升0.4%;在人工评价得分上,相比最优基线方法提升4.2%。
  • 边宁,韩先培,何苯,孙乐
    2022, 36(4): 137-145.
    摘要 (560) PDF (2616 KB) (789)
    高考是综合评估人类知识和能力水平的标准化考试,与传统的自动问答任务相比其挑战性更高。该文面向我国高考试题历史部分,基于深度神经网络技术,构建了历史科目试题自动答题系统。在答题系统中融合知识的一个主要挑战是知识的上下文相关性: 对于一个问题,在知识库存储的大量知识中,只有少数知识与回答该问题相关。针对这一挑战,该文设计了一种结合知识检索与机器阅读理解的知识融合自动答题系统。该系统利用知识检索的相关排序能力和机器阅读理解模型的知识定位能力,有效地发现问题相关的知识,从而增强自动答题的效果。实验结果显示,该系统可有效地作答高考历史科目试题。
  • 魏思,沈双宏,黄振亚,刘淇,陈恩红,苏喻,王士进
    2022, 36(4): 146-155.
    摘要 (586) PDF (3890 KB) (887)
    知识追踪是一项评估学生学习过程中知识状态演变情况的任务。现有大多数方法都致力于探索不同的知识状态评估方法。然而,答题过程中更为基础的题目表征受到的关注相对较少。因此,该文提出了一种融合通用题目表征学习的神经知识追踪框架。具体地,该文首先设计了一种通用的题目表征方法,通过知识点、难度和题目独有特征来区分题目。然后,采用现有知识追踪方法同时捕捉知识状态演变并学习题目表征。最后,利用知识状态和待回答题目表征的内积来模拟回答过程。在三个真实数据集上的实验结果表明,该文方法可以在知识追踪过程中学习精确有效的题目表征,并且显著提升了基线知识追踪方法的性能,使其能够超过现有最优方法。
  • 冯骁骋,张凌源,冯掌印,吴佳铭,孙承杰,秦兵
    2022, 36(4): 156-165.
    摘要 (578) PDF (7069 KB) (348)
    议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,所生成的文章需要句子语义明确、论证结构清晰并合理地表达出核心论点。上述特点使得现有的预训练模型难以准确地建模并自动生成,因此传统的检索式方法成为解决该问题的主要方式。但前人方法在句子检索和排序过程中只考虑了语义相关度,忽视了对逻辑论证关系的判别,导致语义不连贯、论证逻辑倒置等问题。针对上述问题,该文将自然语言推理应用于论证关系逻辑判别任务,提出了基于显式语义结构的论证关系逻辑判别方法,新模型在论证判别数据集上取得优于以往自然语言推理模型的效果。同时将论文判别结果作为显式特征应用于议论文句子排序模型,在议论文生成数据集中有效改善了排序模型的逻辑不一致问题并进一步提升了议论文生成系统的总体性能。
  • 谭红叶,郭少茹,陈鑫,王素格,李茹,张虎,杨陟卓,
    陈千,钱揖丽,王元龙,关勇,吕国英
    2022, 36(4): 166-174.
    摘要 (646) PDF (2550 KB) (692)
    机器阅读理解任务需要机器理解篇章并回答相关问题,是许多应用系统中的一项核心任务。该文面向高考语文中的现代文阅读理解文本语义表示、候选句抽取、鉴赏分析等关键技术展开研究,针对选择题、问答题等构建了相应的答题引擎,并在高考真题及测试题上,对系统进行了实验验证与错误分析,实验结果表明,该文所构建的系统能够在一定程度上解答问题。未来将围绕语义表示、知识的统一表征与知识聚合、迁移学习等前沿技术,提升阅读理解系统的复杂综合推理能力、概括分析能力、语言鉴赏能力。