摘要
本发明公开了一种基于双重反馈机制的金融领域训练数据构建方法,涉及自然语言处理技术领域,该方法包括以下步骤:基于预先获取的初始信息,利用检索增强生成技术检索得到外部知识,结合思维链提示词形成综合信息,并对综合信息进行筛选;通过对话基座模型,将筛选后的综合信息作为对话基座模型的输入,生成逻辑信息,并将逻辑信息通过思维蒸馏生成简洁信息;利用AI教师模型,对简洁信息进行多维度评分,并根据评分结果筛选简洁信息,构建训练数据集。本发明通过输入端的RAG技术和思维链提示词,模型能够获取丰富的金融领域知识;在输出端,利用AI教师模型对生成的答案进行多维度的自动化评分,确保了训练数据集的高质量。