AI资讯新闻榜单内容搜索-智能体

深度｜对话 LangChain 创始人：为什么 Manus 和 Claude Code 这么强？秘诀不在模型，而在顶级 Harness

在 AI 圈，模型至上论正在遭遇前所未有的挑战。当所有人都在屏息等待新模型再次刷新智力天花板时，AI 基础设施领军人物、LangChain 联合创始人 Harrison Chase 在最新对话中抛出了新预判：大模型正在沦为大宗商品，而决定 Agent 成败的，是那个包裹在模型外的 Harness 。

来自主题: AI资讯

8688 点击 2026-04-03 10:16

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体，往往需要大量在线试错与环境探索，这不仅成本高昂，还可能带来显著安全风险：机器人可能因试错而损坏，自动驾驶的在线探索可能危及行车安全，而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报

7829 点击 2026-04-03 09:25

谷歌重磅开源Gemma 4！手机离线跑 Agent、还降内存，Qwen 被拉进正面对决

刚刚，谷歌正式发布 Gemma 4，称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计，采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格：Effective 2B（E2B）、Effective 4B（E4B）、26B 混合专家模型（MoE）和 31B 稠密模型（Dense）。

来自主题: AI资讯

8739 点击 2026-04-03 01:35

消息人士爆料！Anthropic秘密测试核弹级产品 —「永久在线」（Always-On）智能体Conway

就在今天，消息人士爆出：Anthropic正在秘密测试核弹级产品——「永久在线」（Always-On）智能体Conway。也就是说，从此Claude将彻底「龙虾化」！

来自主题: AI资讯

8993 点击 2026-04-03 00:42

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验：做出来的结果，能不能撑得住真实的治疗决策？哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线：与其追求更强的骨干大模型，不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报

7972 点击 2026-04-02 16:22

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

近年来，Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型，智能体能够在内部模拟未来，从而进行规划与决策。但当系统从单机器人扩展到多机器人时，问题开始变得棘手。

来自主题: AI技术研报

9992 点击 2026-04-02 16:22

为什么要把 Agent 变成一只宠物？

昨天 Claude Code 的源码泄露了。巧的是，我正好在重做 CodePilot 的助理系统，游戏化是我已经想了一段时间的方向。泄露的代码给了我一些启发，但更多是验证了判断：这条路是对的。

来自主题: AI资讯

6830 点击 2026-04-02 10:08

NVIDIA GTC上登顶的DeepResearch Bench，到底在评什么？

3 月 16 日，在刚刚结束的 NVIDIA GTC 2026 大会上，黄仁勋在长达三小时的 Keynote 演讲中发布了 NVIDIA Agent Toolkit 和 AI-Q 开放智能体蓝图，将 AI Agent 定位为下一个重大前沿。

来自主题: AI技术研报

8367 点击 2026-04-01 09:39

比龙虾（OpenClaw）还好用的智能体出现了！"爱马仕"智能体（Hermes Agent）！记性好，Skills还能自我进化！

养了很多只龙虾，虽然有几只已稳定在岗，但依旧对OpenClaw脆弱的记忆机制感到恼火，明明昨晚千叮万嘱的工作流，第二天一早就忘的一干二净。虽然也找了各种补丁给OpenClaw打上，但效果却各种不尽人意。

来自主题: AI资讯

9434 点击 2026-03-31 09:50

中国医生「不信 AI」的死结怎么解？医渡智循给你方案

中关村论坛年会上，医渡科技与清华长庚医院等头部医院共同启动了「中国临床循证智能能力建设计划」，与此同时，作为计划核心技术载体与落地产品的「医渡智循」发布了 APP 版本——一款定位为医生「超级助手、第二大脑、多学科智能体专家顾问团」的临床循证决策系统。

来自主题: AI资讯

9577 点击 2026-03-30 09:56