基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品
申请号:CN202511122425
申请日期:2025-08-12
公开号:CN120611192B
公开日期:2025-10-17
类型:发明专利
摘要
本申请提供一种基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品,包括:获取初始样本集合;利用小语言模型对每个任务样本的问题进行多次采样推理,生成多个推理链;基于预设误差评估规则计算每个推理链的整体误差评分,确定待修正推理链;将待修正推理链与对应问题一并输入至大语言模型中,生成经修正的回答;将问题与经修正的回答构成新任务样本,对小语言模型进行部分参数微调;重复执行上述流程,直至模型在任务测评集上的性能指标变化率低于预设阈值,输出最终任务样本;将多个最终任务样本构成训练样本集,对小语言模型进行全参数微调。本申请以模型误差为导向构建训练数据自我优化路径,提升了语义一致性与数据有效性。
技术关键词
节点 有向无环图 计算机程序指令 大语言模型 训练样本集 数据 动态 语义 置信度阈值 模型误差 逻辑 计算机程序产品 处理器 电子设备 答案 自然语言 参数