%0 Journal Article %A 杜家驹 %A 叶德铭 %A 孙茂松 %T 中文开放域问答系统数据增广研究 %D 2023 %R %J 中文信息学报 %P 121-130 %V 36 %N 11 %X 开放域问答是自然语言处理中的重要任务之一。目前的开放域问答模型总是倾向于在问题和文章之间做浅层的文本匹配,经常在一些简单问题上出错。这些错误的原因部分是由于阅读理解数据集缺少一些真实场景下常见的模式。该文提出了几种能够提高开放域问答鲁棒性的数据增广方法,能有效减少这些常见模式的影响。此外,我们还构造并公开发布了一个新的开放域问答数据集,能够评估模型在真实场景下的实际效果。实验结果表明,该文提出的方法在实际场景下带来了性能提升。 %U http://jcip.cipsc.org.cn/CN/abstract/article_3430.shtml