孙泽田,周雨琦,户保田,胡欣硕,赵宇,许天骁,李东方,张民
2024, 38(6):
129-138.
基于搜索引擎的知识对话系统需要解决三个问题: 何时检索(When),检索什么(What),如何将知识与对话历史融合(How)。该文将基于搜索引擎的知识对话系统拆解为三个阶段: 对话模式选择,搜索词生成以及对话回复生成,并对对话模式选择和对话回复生成两个阶段进行优化: 使用置信度校准的方式降低分类结果中假阴性样本的比例,提高对话模式判断的准确率并改善搜索词生成的质量;使用控制编码的方式对生成模型进行约束以提高模型生成回复时的知识利用率,并构建排序器对对话回复做进一步的筛选优化。实验表明,该文的方法对比基线模型有较大的效果提升。在2022年语言与智能技术竞赛的知识对话任务中,该知识对话系统获得第四名的成绩。