
谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名
谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名AI研究智能体全新升级!Meta等推出MLGym,一个专门用于评估和开发LLM智能体的Gym环境。MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中展现真正实力。
AI研究智能体全新升级!Meta等推出MLGym,一个专门用于评估和开发LLM智能体的Gym环境。MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中展现真正实力。
诺奖级AI极大概率会在2026年降临!Anthropic向白宫提出可行的六大建议,从政策层面呼吁美国加速AI创新和风险管控。与此同时,AI正从实验室走向战场,五角大楼决定将智能体加入作战规划中。
OmniParser V2可将屏幕截图转换为结构化元素,帮助LLM理解和操作GUI;在检测小图标和推理速度上显著提升,延迟降低60%,与多种LLM结合后表现优异。
最近AI圈最炸的瓜,毫无疑问是——Manus!一个AI Agent,不仅能刷GAIA Benchmark,还能远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」。听起来确实很能打?但我们 CAMEL-AI的🦉OWL项目看完Manus视频,集体摊手:就这?0天复刻走起!
AI Agent是一个应该非常个人化的东西。
Manus发布后的火爆完全超出了团队预期,注册端口还遭到了暴力破解,团队一直在处理各种问题,目前仍处于超负荷运转状态。
码来!
less structure,more intelligence.
Manus 被喷了一天。3/5晚上发布时,几乎所有我关注的AI开发者都在转发,集体情绪是非常兴奋的。大家都觉得这是一个非常牛逼的产品。然后早上各大AI自媒体发了测评,情绪推向了极致。
最近两天,我们见证了 Manus 的破圈。但邀请码一码难求。这就不禁让我想到,是否能做一个开源版呢?于是和同事吃完饭的时候一拍即合,回公司搓了三个小时,终于把这个 OpenManus 完成了!