基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品

申请号：CN202511122425

申请日期：2025-08-12

公开号：CN120611192B

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供一种基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品，包括：获取初始样本集合；利用小语言模型对每个任务样本的问题进行多次采样推理，生成多个推理链；基于预设误差评估规则计算每个推理链的整体误差评分，确定待修正推理链；将待修正推理链与对应问题一并输入至大语言模型中，生成经修正的回答；将问题与经修正的回答构成新任务样本，对小语言模型进行部分参数微调；重复执行上述流程，直至模型在任务测评集上的性能指标变化率低于预设阈值，输出最终任务样本；将多个最终任务样本构成训练样本集，对小语言模型进行全参数微调。本申请以模型误差为导向构建训练数据自我优化路径，提升了语义一致性与数据有效性。

技术关键词

节点有向无环图计算机程序指令大语言模型训练样本集数据动态语义置信度阈值模型误差逻辑计算机程序产品处理器电子设备答案自然语言参数