一种大模型多类型工具协同推理方法、系统及设备

申请号：CN202511261103

申请日期：2025-09-05

公开号：CN120745849A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开一种大模型多类型工具协同推理方法、系统及设备，涉及人工智能和自然语言处理技术领域，包括：针对原推理路径，计算每次调用推理工具后当前推理节点的熵值，并以此确定熵变化量，根据熵变化量与阈值的比较，确定高token熵节点；在高token熵节点处进行下一次推理工具调用时，随机调用与原推理路径不同的推理工具并继续执行推理过程，生成新推理路径；将原推理路径和生成的所有新推理路径作为训练集，对大模型基于强化学习算法进行训练。设计基于token熵的自适应探索与强化学习策略，实现了大模型在不确定情况下的推理工具选择策略的智能化提升，提高最终答案的推理准确性。

技术关键词

推理方法强化学习算法答案节点处强化学习策略训练集词典推理系统标识自然语言处理器模块参数指令存储器计算机因子电子设备