李开复陆奇重仓同一家Harness智能体公司,李笛带队,4个月2轮融资3-5年粮草
李开复陆奇重仓同一家Harness智能体公司,李笛带队,4个月2轮融资3-5年粮草多智能体赛道爆发,Harness成为破局关键,资本加速布局。
搜索
多智能体赛道爆发,Harness成为破局关键,资本加速布局。
他还在开发一个CEO智能体。
一不小心,查理芒格和巴菲特就被炼化,个个加入投资Agent军团,人人可用了。
刚刚,荣耀在PC新品技术沟通会上正式发布了其自研的端侧“龙虾”AI智能体“YOYO Claw”,YOYO Claw会首发搭载在荣耀MagicBook系列轻薄本新品中。
随着任务的复杂度提升,Agent(智能体)的上下文在无限膨胀。在无穷的历史对话、工具调用输出、中间步骤以及报错信息中,模型迷糊了,于是开始跳步、忽视、绕道。
在本文中,我将探讨编码智能体(coding agents)及其智能体编排(agent harnesses)的整体设计:它们究竟是什么、工作原理如何,以及在实际应用中各组件是如何协同运作的。
LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。
T (R,O) Grasp 是一种基于物体 — 机器手空间关系建模的图扩散架构,具备跨智能体的统一表征能力。在 NVIDIA 40GB A100 GPU 上,该方法可实现 5 FPS 的推理速度和 50 grasp/s 的吞吐量,并在多种智能体上取得 94.83% 的平均抓取成功率,刷新了跨智能体灵巧抓取的 SOTA,具备与动态场景实时交互的能力。
Braintrust 是一家做 AI 产品可观测性和评估的公司。你可以理解为:帮你监控和调试 AI 智能体的工具。他们发现,现有的数据库——无论是 Postgres、数据仓库还是浏览器端的 DuckDB——全都扛不住 AI 工作负载。于是他们做了一个很大胆的决定:自己造一个数据库。
近日,在由 OpenAI 主导设立的权威基准测试 MLE-Bench 上,企业级算法自主优化智能体百度伐谋(Famou)击败了各路玩家登顶,并刷新了 SOTA 成绩。