摘要
本发明公开一种大模型多类型工具协同推理方法、系统及设备,涉及人工智能和自然语言处理技术领域,包括:针对原推理路径,计算每次调用推理工具后当前推理节点的熵值,并以此确定熵变化量,根据熵变化量与阈值的比较,确定高token熵节点;在高token熵节点处进行下一次推理工具调用时,随机调用与原推理路径不同的推理工具并继续执行推理过程,生成新推理路径;将原推理路径和生成的所有新推理路径作为训练集,对大模型基于强化学习算法进行训练。设计基于token熵的自适应探索与强化学习策略,实现了大模型在不确定情况下的推理工具选择策略的智能化提升,提高最终答案的推理准确性。