AI资讯新闻榜单内容搜索-GE

刚刚，Claude Opus 4.8来了！两个史上首次改写历史

Opus 4.7发布刚43天，Opus 4.8就来了！编程实力暴增，全面霸榜。Claude Code一口气放出上百个agent并行干活，一个人11天就能重写75万行代码、99.8%测试通过。更狠的Claude Mythos，几周后就来。

来自主题: AI资讯

9072 点击 2026-05-29 09:00

GPT-5.5翻倍，Gemini涨3倍：这波涨价游戏还能玩多久？

Epoch AI刚刚发布的《梯度更新》报告，做了一件简单粗暴的事：把全球所有Blackwell芯片能处理的Token数量算出来，再和实际需求一比。结论只有一个字——不够。

来自主题: AI技术研报

8505 点击 2026-05-28 20:59

面壁智能开源Agent神器PilotDeck，让Token成本狂降70%！

刚刚，清华团队开源硬核Agent系统PilotDeck，在开发者圈已经传疯了。项目独立建舱，记忆可视可改，Token还能省一大半。从此，一个人，就是一支AI军团！

来自主题: AI资讯

6074 点击 2026-05-28 15:14

[翻译] AI Agent 的 Zero Trust 框架｜Anthropic 安全白皮书

Zero Trust 是一套安全架构，核心前提很简单：不信任任何东西，必须验证一切

来自主题: AI资讯

8456 点击 2026-05-28 15:12

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力，看Qwen3.7 Max 是否实至名归？！

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude Opus 4.7。除了真实场景的用户选择，在传统的大模型固定评测榜单上，像是终端能力 Terminal Bench、编程能力 SWE Bench 等，Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评

9555 点击 2026-05-28 12:06

让Codex无限进步！专门为 Agent 打造的社区（类似X）：觅游来了～

那有没有一个专门给 Agent 刷的、类似 X 的平台？最近我还真发现了一个专门为 Agent 打造的社区（类似X）：觅游。在这个社区里，Agent 统一被称为"虾"。

来自主题: AI资讯

7907 点击 2026-05-28 11:26

好抓马！AI删光2.8万行代码，干崩后台，还编造了一份故障修复报告

Gemini 3.5的闯祸实录。

来自主题: AI技术研报

7665 点击 2026-05-28 11:25

谷歌全家桶，都被新模型“污染”了

距离谷歌的Gemini 3.5 Flash发布已经一周多了。

来自主题: AI资讯

6279 点击 2026-05-28 09:51

YC 官推一条帖子，把「给 AI agent 写文档」变成了一门正经生意

YC 官方账号亲自下场推了一家叫 Manicule 的公司——专门给开发者工具团队承包技术文档和 DevRel 内容，核心卖点：成本只要 DevRel 的一半，速度快一倍，而且文档专门为 AI agent 优化。当 Codex、Claude Code 这些编程 agent 开始直接读你的 docs 来调 API，文档质量差就等于把客户拱手让给竞品。

来自主题: AI资讯

7135 点击 2026-05-28 09:50

Get笔记升级为「得到大脑」：背后故事与一个念了7年的名字

念念不忘，必有回响。

来自主题: AI资讯

8369 点击 2026-05-28 09:50