AI资讯新闻榜单内容搜索-Gen

胜率直逼人类大师！这套Agent揭开中国AI「玄学真相」

没有信息泄漏的专业术数题库面前，Claude、GPT等主流模型集体「翻车」。但一个叫Tianfu Agent的系统，却一举将准确率提升至50%，逼近本届术数大赛人类Top20选手的53.5%平均水平。

来自主题: AI资讯

5905 点击 2026-05-25 15:11

实测 OmniWork：搞调研、做动画、造游戏，用 AI 攒一个「全干班子」是什么体验？

下一代创作软件比的不是模型能力，而是谁能把完整的创作流程跑通。能让 Agent 从接到目标开始，一路协作推进到交付成品的系统，才是真正的竞争力。 OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」，面向创作工作的 Agent 操作系统。

来自主题: AI产品测评

8346 点击 2026-05-25 15:05

挖到个巨省Token的开源Agent，还能以复利的方式变现（企业、开发者必看）！

大家好，我是袋鼠帝。不知道大家有没有发现，随着AI的发展，token这个东西居然还变得越来越贵了。

来自主题: AI技术研报

8915 点击 2026-05-25 14:45

AI Agent 距离真正替人「全自动办公」，还有多远？

近日，Meta 曝光的一段内部录音显示：公司为了训练大模型，正通过监控工具监视员工在电脑上的鼠标和键盘操作。

来自主题: AI技术研报

9991 点击 2026-05-25 10:13

Claude比你更懂你的需求？Anthropic工程师公开内部用法：用HTML作为AI规范，反而比Markdown更省Token；让“验证”成为Agent的原生特性

“Claude 可能比你更擅长从你这里提取出你想要和需要的东西，而不是由你向 Claude 详细指定。”

来自主题: AI资讯

6270 点击 2026-05-25 09:50

80集短剧，3天拍完：当电影人下场做Agent，影视生产迎来了“最懂行”的解法

很多人以为，AI视频的终点是“生成一段让人惊艳的画面”。

来自主题: AI资讯

10161 点击 2026-05-25 09:48

RSS 2026｜机器人别等失败了才补救，AgentChord让恢复动作提前写进任务图

机器人操作正在从结构化工业场景走向更开放的真实环境。相比完成单个预设动作，真实任务往往包含更长的执行链条、更复杂的物体交互，以及更多不可控的外部扰动。一次抓取没有完全夹稳、目标物体被轻微碰偏、双臂交接时姿态出现偏差，都可能让后续步骤偏离原本计划。

来自主题: AI技术研报

7635 点击 2026-05-25 09:46

小红书灰度Skill上传入口，内容平台分发skill，B站、知乎会跟进吗？

近日，小红书开始灰度开放Skill上传入口，提出了一个值得认真对待的问题：在 Skill生态中，内容平台究竟扮演什么角色？和大厂推出的Agent平台之间，是竞争关系，还是正在形成某种协作分工？

来自主题: AI资讯

8749 点击 2026-05-24 14:11

Bengio新论文刷新递归推理上限，并行轨迹碾压串行推理

现在，图灵奖得主 Yoshua Bengio 给出了一份全新的并行方案。他们提出了 GRAM（Generative Recursive reAsoning Models，生成式递归推理模型），把确定性的递归潜在推理变成了概率性的多轨迹计算。模型在潜在空间中进行随机递归推理，每一步都可以采样不同的方向，最终形成对解空间的多路径探索。

来自主题: AI技术研报

9217 点击 2026-05-24 10:12

谷歌搜索智能体大升级，AI却直接「罢工」了？

本周的 I/O 大会上，谷歌推出了智能体（Agent）时代的全新搜索体验，号称 25 年来对自家搜索引擎的首次重大更新。就在大家满怀期待都开始大用特用的时候，却发现了一系列 bug。

来自主题: AI资讯

9211 点击 2026-05-23 17:09