AI资讯新闻榜单内容搜索-智能体框架

ARC-AGI-3近被完美攻破，这个Harness能让AI掌握物理学家思维

7 月 16 日，伯克利博士后 Haven Feng 的一条推文火了。原因无他，结果很震撼：在 ARC-AGI-3 Public 集上，一套名为 [schema] 的智能体框架，与 Claude Opus 4.8、Fable 5 组合后达到 98.98% 的 RHAE；换成 GPT-5.6 Sol 组合，分数也有 95.35%。

来自主题: AI技术研报

9704 点击 2026-07-18 14:22

当AI开始重写自己：EverMind的自进化智能体框架Raven，正在定义数字生命的下一个形态

这个问题，在 AI 行业有一个专业的说法：无状态（Stateless）。而解决这个问题，正是 EverMind 过去一直在做的事情。今天，这个探索走到了一个新的节点：基于自研记忆系统 EverOS 的自进化Harness——Raven Agent 正式发布。

来自主题: AI资讯

9568 点击 2026-07-08 16:07

竞赛编程Agent进入全球前十！南大、清华新模型CF rating超3500

大语言模型在代码生成上的能力不断增强，但在复杂算法题，尤其是竞赛编程场景中，仍然容易因为算法选择错误、边界条件遗漏、复杂度判断失误或隐藏测试覆盖不足而失败。Solvita是一款面向竞赛编程的智能体框架，通过四个角色（Planner、Solver、Oracle、Hacker）形成闭环系统，并利用可训练的图结构知识网络积累经验。

来自主题: AI技术研报

8905 点击 2026-07-08 15:09

更可信、更省钱的Agent？实测OpenSquilla

上周有个项目，让我觉得很有意思。GitHub上一个叫OpenSquilla的，发布不到一个月，Star涨到了5300多。OpenSquilla 0.4.0，定位Token-Efficient AI Agent，是一个很有效率又很有创意的智能体框架。

来自主题: AI技术研报

9807 点击 2026-07-06 19:34

斩获15个顶级零日漏洞：0G Lab联合新国立，北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议（Consensus Protocols），长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织，传统测试和单体 LLM 对硬核的 Deep Bug（深层逻辑漏洞）几乎束手无策。

来自主题: AI技术研报

10806 点击 2026-06-11 14:59

DeepSeek V4做数学证明，500倍成本优势：智能体系统刷新多项纪录

近日，普林斯顿大学的研究团队发布了一篇新论文，提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型，是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报

9401 点击 2026-06-07 10:56

超越Claude Mythos和GPT-5.5！斯坦福Agent验证框架拿下SOTA，Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架，该方法是一种通用的验证机制，可与任意Agent Harness和模型结合。

来自主题: AI技术研报

9891 点击 2026-04-27 15:18

乐鑫龙虾 ESP-Claw 来了！聊天就能开发智能设备

乐鑫信息科技 (688018.SH) 正式推出 ESP-Claw —— 以 Chat Coding（聊天造物）为核心的 AI 智能体框架。它突破了编程边界，让人人都能通过对话定义智能设备。

来自主题: AI技术研报

10864 点击 2026-04-22 10:43

新一代记忆智能体框架MIA：让智能体告别「失忆式工作」，在持续进化中变强

如今的大多数智能体，仍然活在一种「失忆式工作」模式中：每一次检索都是从零开始，每一条推理路径都无法沉淀，每一次失败也不会转化为经验。它们虽能多轮交互，但很难在深度研究中持续变强。

来自主题: AI技术研报

9834 点击 2026-04-20 14:02

UniPat AI开源SWE-Vision：五百行代码打造SOTA视觉智能体！

多模态大模型在代码能力上进步惊人，但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架 ——SWE-Vision，让模型可以编写并执行 Python 代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中，SWE-Vision 均达到了当前最优水平。

来自主题: AI技术研报

10150 点击 2026-03-16 14:25