高级检索

ECPE-Qwen:微调大语言模型进行零样本情绪原因对抽取

ECPE-Qwen: Zero-shot Emotion-cause Pair Extraction with Fine-tuning Large Language Models

  • 摘要: 情绪原因对抽取(ECPE)任务的目标是从文本中抽取情绪子句及造成该情绪的原因子句。研究人员已经基于零样本和少样本提示等方法将大语言模型应用于该任务,但到目前为止基于大语言模型的方法输出不可控,性能一般。为提升大语言模型在ECPE任务上的性能并约束其针对该任务的输出方式,该文引入了数字标识符样式的零样本指令构造方式,以全局文本视角基于低秩适配器(LoRA)方法在情绪子句抽取、原因子句抽取和情绪原因对抽取的三阶段任务上对Qwen 1.5系列的基础模型进行联合微调,指导大语言模型建模句间的情感关系。实验结果表明,与最先进的基于循环神经网络及其变种的方法及基于大语言模型的方法相比,ECPE-Qwen的能力更强,其中仅1.8B规模的ECPE-Qwen即可达到GPT-3.5的能力水准。最后,该文从多维度分析了该模型的可行性、有效性与局限性,包括多个情绪原因对抽取、参数量规模以及待抽取文本中子句数目变化带来的影响。

     

    Abstract: The goal of the Emotion-Cause Pair Extraction (ECPE) task is to extract emotion clauses and the corresponding cause clauses from a given text. To enhance the performance of LLMs on the ECPE task, we introduce a zero-shot instruction construction method using numerical identifiers. From a global text perspective, we employ the Low-Rank Adapter (LoRA) method for fine-tuning the Qwen1.5 base model across three stages: emotion clause extraction, cause clause extraction, and emotion-cause pair extraction. This approach guides the LLMs in modeling inter-sentence emotional relationships. Experimental results demonstrate that ECPE-Qwen model, with only 1.8 billion parameters, achieves performance on par with GPT-3.5.

     

/

返回文章
返回