AI资讯新闻榜单内容搜索-agent

o3 Gemini 都翻车？首个可验证长链 GUI 数据集 VeriGUI 重磅开源，探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起，有望彻底改变人机交互的方式。然而，这一领域的进展正面临瓶颈：现有数据集大多聚焦于 10 步以内的短程交互，且仅验证最终结果，无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯

6028 点击 2025-08-13 16:17

新加坡的Agent黑马Agnes，双杀技能：Deep Design × Wide Research重新定义智能体？

之前在X上看到过一个新加坡版的DeepSeek，叫Agnes AI，主打一站式Agent空间。但当时我自己搞产品焦头烂额的，随手点开看了看，就放下了。后来在Product Hunt上又看到这款产品，以及各种海外平台时而刷到。

来自主题: AI资讯

6525 点击 2025-08-13 12:32

从物竞天择到智能进化，首篇自进化智能体综述的ASI之路

近年来，大语言模型（LLM）已展现出卓越的通用能力，但其核心仍是静态的。面对日新月异的任务、知识领域和交互环境，模型无法实时调整其内部参数，这一根本性瓶颈日益凸显。

来自主题: AI技术研报

5660 点击 2025-08-13 11:32

AI应用如何落地政企？首先不要卷通用大模型

智能体元年，处处都是智能体。甚至刚落幕的ISC.AI 2025第十三届互联网安全大会，主题直接就是“ALL IN AGENT”。

来自主题: AI资讯

5822 点击 2025-08-13 11:05

MiniMax 悬赏 15 万美元，重金求「子」

MiniMax 现在正在主动加速「从功能到可流通生产力」的进程。他们正在举办一场总奖金高达 15 万美元的 AI Agent 全球挑战赛，核心理念是「让自己的 Idea + Agent 成为生产力，成为市场中的硬通货」。Remix 则是官方重点推荐的参赛入口之一。

来自主题: AI资讯

6082 点击 2025-08-13 10:34

第一个能帮你做生意的Agent来了。

全世界可能是第一个，能做生意的Agent来了。这，就是阿里国际站最近升级的Accio Agent。

来自主题: AI资讯

5138 点击 2025-08-13 10:10

苹果 AI 下半场：年底问世的新 Siri，要彻底改变 iPhone 的交互

从上周开始，我们就开始看到一些关于苹果在人工智能领域的长期规划开始浮出水面：从名为 AKI、力求在 iPhone 端侧打造「类 ChatGPT 搜索体验」的答案引擎，到本周目标指向 AI Agent 能力的「新 Siri」概念爆出。无数消息都指向了一个目标：「重生」。

来自主题: AI资讯

5495 点击 2025-08-12 16:44

从开源项目到2500万美元融资：如何打造下一代AI Agent的互联网基础设施

Tavily AI 的故事开始于一个开源项目。创始人 Rotem Weiss 在 2023 年创建了一个叫做 GPT Researcher 的开源工具，目的是让大语言模型能够获取实时的网络数据。当时 ChatGPT 还没有接入互联网搜索功能，这个小工具迅速在开发者社区中走红，收获了近 2 万个 GitHub stars。

来自主题: AI资讯

7699 点击 2025-08-11 14:14

Sheet0.com王文锋，两人团队融资500万美元，要打造属于Agent的Google.com

创始人王文锋作为连续创业者，在AI、基础软件与大规模分布式数据处理领域的近十年工作经验，让他在数据工程、上下文构建（Context Engineering）以及可组合系统架构上具备深厚功底。这不仅让 Sheet0 能在技术实现上跑得更快、更稳，也让他在市场节奏与产品定位上有着极为稀缺的超前判断力。

来自主题: AI资讯

7621 点击 2025-08-11 14:10

ARPO：智能体强化策略优化，让Agent在关键时刻多探索一步

在可验证强化学习（RLVR）的推动下，大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中，LLM 往往需要结合外部工具进行多轮交互，现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。

来自主题: AI技术研报

5366 点击 2025-08-10 13:29