AI资讯新闻榜单内容搜索-训练

Claude Code和机器人背后的共同机制，UIUC、Meta、Stanford这篇最新综述讲清楚了

说在前面：这又是一篇讲Harness的Survey，你最近可能已经看过了数篇讲Harness的文章、论文，其中还可能包括我上周解读的《Agent Harness Engineering：Agent的底盘工程综述｜CMU、耶鲁、Amazon》。

来自主题: AI技术研报

11403 点击 2026-05-27 08:46

马斯克曝光Grok 5！1.5万亿参数，偷师Cursor狂练编程

马斯克深夜官宣：1.5万亿参数Grok V9训练完成，现役三倍！更狠的是，训练数据直接灌入大量Cursor编程交互记录。几乎同一时间，更劲爆的细节浮出水面——训练过程中，xAI往模型里灌入了大量Cursor编程数据。

来自主题: AI资讯

8973 点击 2026-05-26 16:51

不用人类手写训练框架了！AI自己写代码，训出1B端侧「小钢炮」

你的电脑里，或许很快会住进一只会聊天的「小怪兽」。

来自主题: AI技术研报

10219 点击 2026-05-26 16:06

一个月的活一周干完！英伟达世界模型训练速度飙升400%

英伟达世界动作模型 DreamZero 训练一次要烧 8 张 H100 整整 25 天，RLinf 从算子融合到 I/O 全链路系统级重构，把训练吞吐拉高近 4 倍——1 个月的活，1 周就能干完。

来自主题: AI技术研报

7599 点击 2026-05-26 16:04

面壁智能推出AI写的预训练框架ForgeTrain，从此AI开始造自己

造AI这件事，现在的主角变成了AI。

来自主题: AI技术研报

7907 点击 2026-05-26 16:03

0.9B跑出90%真机成功率！上海交大为VLA补上空间感

机器人看得见，但不一定看得准。

来自主题: AI技术研报

5845 点击 2026-05-26 15:23

画数独、烧蜡烛都不翻车了？浙大&阿里让AI先三思再下笔｜ACL 2026

当下视觉生成正陷入一个能力错位困境—— 扩散模型的像素画质已接近完美，但一遇到需要逻辑推理的生成任务就频频翻车。

来自主题: AI技术研报

6638 点击 2026-05-26 14:58

ACL 2026 Main | 不只是调用地图API，Spatial-Agent让大模型生成可执行地理分析工作流

大语言模型在地图、城市、交通等空间领域的应用越来越广泛。对于这些场景来说，问题往往不只是 “查一个地点” 或 “调用一次路线 API” 就能解决的，而是需要把用户的自然语言问题组织成一段可执行、可验证的地理分析流程。

来自主题: AI技术研报

9229 点击 2026-05-26 14:57

Grok最新模型吃上Cursor「加餐」，Grok基础模型V9-Medium（1.5T）已完成训练

马斯克在X上发帖透露，xAI自家的Grok基础模型V9-Medium（1.5T）已经完成训练。预计再过2到3周，差不多就能正式对外发布啦：马斯克特意提到，V9-Medium的补充训练中加入了大量Cursor数据，后续还会继续添加。

来自主题: AI资讯

9126 点击 2026-05-26 12:10

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

8403 点击 2026-05-26 10:26