AI资讯新闻榜单内容搜索-AReaL

Agent的自演进，被刚刚开源的AReaL 2.0按下了加速键

当 Agent 从演示视频中的炫技片段开始走进真实工作流与生产环境，下一阶段的「何去何从」成为业界关注的焦点。

来自主题: AI技术研报

6048 点击 2026-07-02 14:31

补齐OpenClaw进化拼图！AReaL v1.0开源，智能体强化学习「一键接入」

2026 开年已两个月，Agent 依然是全球最引人注目的 AI 赛道之一。OpenClaw（原 Clawbot）掀起的那波 Agent 热潮至今仍在发酵，甚至让「一人公司」概念第一次真正有了落地的可能性。

来自主题: AI技术研报

10583 点击 2026-03-04 13:46

让GPU不再摸鱼！清华蚂蚁联合开源首个全异步RL，一夜击穿14B SOTA

清华与蚂蚁联合开源AReaL-boba²，实现全异步强化学习训练系统，有效解耦模型生成与训练流程，GPU利用率大幅提升。14B模型在多个代码基准测试中达到SOTA，性能接近235B模型。异步RL训练上大分！

来自主题: AI技术研报

7447 点击 2025-06-05 16:30

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

想训练属于自己的高性能推理模型，却被同步强化学习（RL）框架的低效率和高门槛劝退？AReaL 全面升级，更快，更强，更好用！

来自主题: AI技术研报

8430 点击 2025-06-04 14:05

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learning）成为了大语言模型能力提升的新引擎。然而，针对大语言模型的大规模强化学习训练门槛一直很高：

来自主题: AI技术研报

11825 点击 2025-03-31 15:07