最强黑客大模型,不再是Mythos
最强黑客大模型,不再是Mythos微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
搜索
微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
47 天 GitHub 破万星,飞书 CLI 彻底火了!26 年春季,飞书已经成为开发者用脚投票选出的最佳 Agent 工作平台。
TencentDB Agent Memory 全球正式开源
Anthropic 将 Agent SDK 用量从订阅中剥离,按 API 零售价另给固定额度。重度用户的可用量缩水近十倍。同一周,OpenAI 向企业用户推出 Codex 两个月免费迁移。ASI 决赛圈的第一场定价战,开打了。
把 Agent 从单体,组成一支可以协作的 Agent Teams。
今天,MiniMax Agent 桌面端完成了一次重大更新。新加入了一个名为 Mavis 的模式(其实它是「MiniMax as a Jarvis」的缩写)。MiniMax 给它的 Agent Team 基础设施起的名字叫做 Team Engine,引擎下面挂着三类核心角色:Leader、Worker、Verifier。顾名思义,一类做管理,一类干活,一类验收。
刚刚,Hermes Agent 确认被投毒了!白天摸鱼的时候,发现有人说 Hermes Agent 依赖的一个 PyPI 包 mistralai 可能被投毒了。虽然不是 Hermes Agent 本体出问题了,但这事影响一点都不小。
我们要做消灭软件的软件。
「Agent Harness」是「套壳」的另一种说法。
Agent 到底需要什么样的 infrastructure,今年业界一直有很多探讨,PingCAP 联合创始人黄东旭此前也发过多篇讨论文章,不过当时都是一些猜想。随着 agent 今年的爆发,大规模落地的案例出现了。