
将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思
将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM,以实现问题的深入理解与解决。
来自主题: AI技术研报
5456 点击 2025-02-07 16:16