强化学习让大模型自动纠错,数学、编程性能暴涨,DeepMind新作 关键词: 强化学习,大模型,AI,SCoRe,自我纠正 无需依赖外部反馈或额外模型,纯纯的自我纠正。 来自主题: AI技术研报 5784 点击 2024-09-21 18:07