Claude Code爆火背后的Agent Harness底层逻辑,UIUC、Meta、斯坦福深度解读
Claude Code爆火背后的Agent Harness底层逻辑,UIUC、Meta、斯坦福深度解读过去两年,大模型写代码已经不再新鲜。从代码补全到 GitHub issue 修复,从竞赛编程到仓库级软件工程,人们习惯用一个简单标准评估 coding agent:代码能不能写对?测试能不能通过?
搜索
过去两年,大模型写代码已经不再新鲜。从代码补全到 GitHub issue 修复,从竞赛编程到仓库级软件工程,人们习惯用一个简单标准评估 coding agent:代码能不能写对?测试能不能通过?
就在刚刚,Claude Fable 5和Claude Mythos 5同时上线。那个被Anthropic藏了两个月、说「太危险不能公开」的Mythos级模型,第一次交到了所有人手上。 Fable这个名字来自拉丁语fabula,和希腊语mythos同源。
今日,美团GN06(原光年之外)团队正式发布AI浏览器Tabbit V1.0,并承诺核心功能将永久免费开放。Tabbit自3月2日开放公测至今,正好是100天,每周迭代,共迭代12个版本,收获了大量用户好评,比如“Windows上最好看的浏览器”、“特别务实的工具产品”、“低门槛且安全稳定地用到头部模型的方式”等等。
HALOFLY是一款面向企业家、投资人等高价值创造人群的“AI合伙人”。产品采用“一脑多身”的本地优先(Local-First)架构,以语音作为核心交互入口,通过长期协作与偏好学习,帮助用户沉淀个人认知资产,完成跨设备、跨应用的信息处理与任务协同,逐渐形成“共思共行”的默契。
今日,小米MiMo团队与推理系统团队TileRT联合宣布,Xiaomi MiMo-V2.5-Pro的UltraSpeed模式已实现万亿参数(1T)旗舰模型输出速度首次突破1000 tokens/s。
一个约 1B 参数的模型,在 MATH 上拿到 56.2,在 GSM8K 上拿到 84.5,在 ARC-Challenge 上拿到 81.9。训练成本约 1500 美元,16 块 H100 跑了不到两天。
好家伙,卡帕西又说对了!
昨天,奇绩创坛举办了 2026 年春季创业营路演日,共有 56 个项目上台。从赛道分布来看,覆盖: 智能体(39 家)、具身与物理智能(19 家)、数据(10 家)、AI 基础设施(14 家)、FDE & AI 咨询(10 家)。
大模型还在混战,AI及智能硬件市场先跑出了三个“爆款”:AI眼镜、AI录音笔、3D打印机。
在去年AI硬件刚火起来的时候,「elsewhere」就听说过一家公司,角度颇为清奇:一个00后,做了一个智能戒指,面向全球数十亿基督教人群,一上来就拿了不少钱。