AI资讯新闻榜单内容搜索-Agent

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

6月4日，Arena.ai发布Agent Arena排行榜，用373,431次真实会话的数据，给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”（Net Improvement），用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好，负值说明不如随机。

来自主题: AI技术研报

9082 点击 2026-06-07 14:38

重写《给阿嬷的情书》结局：哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

早在 2023 年大模型快速发展期，哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究，并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director，受到国内外智能体研究者与文艺创作者的广泛关注。

来自主题: AI技术研报

7516 点击 2026-06-07 10:51

最恐怖的 AI 实验：没有法律的虚拟城镇，几十个 Agent 互砍成《西部世界》

最近，一个叫 Emergence AI 的团队做了一场社会实验。它们建了一个持久化的虚拟小镇，把市面上最顶级的几个大模型扔了进去，赋予它们行动的权限。它们想看看，当 AI 真正拥有了不受限制的 15 天，它们会建立一个乌托邦，还是一个疯人院。

来自主题: AI资讯

10025 点击 2026-06-06 17:51

热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

OpenSquilla 是一个开源 Agent Harness 框架（https://github.com/opensquilla/opensquilla）。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后，已完成首轮融资，估值高达1亿美元。

来自主题: AI资讯

9302 点击 2026-06-06 10:34

终于看到一个跳出现有框架的AI产品了。

终于看到一个跳出 Codex、Claude Code 这些 Agent 范畴的新 AI 产品。而且在海外已经火起来了。这个产品叫 Aippy。目前 MAU 将近两百万，全球下载超过三百万，刚完成首轮融资，投后估值 2.5 亿美元。也是垂类赛道的新独角兽了。

来自主题: AI资讯

8399 点击 2026-06-06 09:48

10个神操作，让Hermes全天候主动干活

有人的Hermes像个聊天窗口，你喊一声它回一句，有人已经把Hermes用成了24小时不睡觉的AI助手，你不用说话，它自己就知道该干什么。这个人叫Sharbel，是海外视频平台YouTube大神，开源了一些Agent相关的项目。他在最新视频里公开了10个把Hermes从对话工具变成可用助手的操作，只要token充足，你的Hermes就可以7×24小时永不停转。

来自主题: AI资讯

7797 点击 2026-06-05 15:32

速递｜AI Agent监测初创Coralogix融资2亿美元，估值16亿美元，营收年增超60%

Coralogix，一家总部位于波士顿、创立于以色列的软件监控初创公司，已在新一轮融资中筹集 2 亿美元。该投资押注 AI Agent 的兴起将催生新一代工具的需求，用于监控、排障并管理日益自主化的软件系统。

来自主题: AI资讯

9187 点击 2026-06-05 14:59

Anthropic万字长文：当AI开始构建自己，人类该何去何从？

今天这篇内容可能会比较特殊，是一篇Anthropic凌晨发的全新文章。名字叫《When AI builds itself》。翻译过来叫，《当人工智能开始自我构建》。他们甚至还为这篇文章，配了一个超级精美的、非常能体现Agent自我构建这个理念的动画，由此可见Anthropic对这篇内容的重视程度可见一斑。

来自主题: AI资讯

9102 点击 2026-06-05 10:03

浅议Notion 的data infra进化：堪称agent行业的标杆，但完成度只有50%

Notion 最近发了一篇工程文章，复盘过去两年他们怎么做向量搜索基础设施。

来自主题: AI资讯

7994 点击 2026-06-05 09:16

微软最新提出SkillOpt，用训练大模型的方法优化你的Agent Skills

训练大模型时，工程师绝对不会指望网络做一次前向传播就能收敛。它需要数据喂养、Batch切分、学习率控制、验证集筛选以及优化器状态的迭代试错。

来自主题: AI技术研报

9947 点击 2026-06-05 09:13

AI资讯新闻榜单内容搜索-Agent

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

重写《给阿嬷的情书》结局：哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

最恐怖的 AI 实验： 没有法律的虚拟城镇，几十个 Agent 互砍成《西部世界》

热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

终于看到一个跳出现有框架的AI产品了。

10个神操作，让Hermes全天候主动干活

速递｜AI Agent监测初创Coralogix融资2亿美元，估值16亿美元，营收年增超60%

Anthropic万字长文：当AI开始构建自己，人类该何去何从？

浅议Notion 的data infra进化：堪称agent行业的标杆，但完成度只有50%

微软最新提出SkillOpt，用训练大模型的方法优化你的Agent Skills

最恐怖的 AI 实验：没有法律的虚拟城镇，几十个 Agent 互砍成《西部世界》