王云鹤眼中的Harness:复杂优化问题,AGI灵魂争夺之战
王云鹤眼中的Harness:复杂优化问题,AGI灵魂争夺之战最近一段时间,Agent 又一次成为 AI 圈最热的关键词。
搜索
最近一段时间,Agent 又一次成为 AI 圈最热的关键词。
过去,一部动画短片的诞生往往需要数月甚至一年的漫长周期。从分镜、原画、建模到渲染,每一个环节都堆砌着密集的人力与时间成本。但在上周末,北京三里屯的一场活动,彻底颠覆了这一传统认知。
DeepSeek最新热招岗位已上线:Agent Harness产品经理。
近年来,大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时,传统的链式思维(Chain-of-Thought)往往就开始「吃力」:容易被早期判断带偏、发散不足、自我纠错弱,而且顺序生成的效率天然受限。
扩散模型杀进了文本生成的地盘,而巨头们为了抢它,已经打起来了。
时隔近一年,那个在 B 站教大家阅读 AI 论文的大神李沐 @跟李沐学 AI,终于回归了!
刚刚,华为支持的开源 AI Agent 平台社区 openJiuwen 发布并开源了蜂群智能体 JiuwenSwarm。
2026 年 5 月,深度机智(DeepCybo)迎来成立一周年。
Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。
在大模型后训练中,数据不再只是 “越多越好”,而是要像人类学习一样,动态选择最合适难度的样本。华为提出的 EDCO 方法,将样本难度估计与动态课程编排引入领域大模型微调;数月后,由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO,并将其作为难度感知强化学习训练的重要对比基线。