AI资讯新闻榜单内容搜索-RL

像开发软件一样造世界，Agent2World来了，把世界模型做成可运行的符号环境

让模型真正 “能行动”，往往需要一个可执行、可验证的符号世界模型（Symbolic World Model）：它不是抽象的文字描述，而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题，或可运行的环境代码 / 模拟器。

来自主题: AI技术研报

7717 点击 2026-02-03 09:11

世界模型迎来高光时刻：谷歌还在闭源，中国团队已经把SOTA级世界模型全面开源了，LingBot-World正面硬刚Genie 3，彻底打破了全球垄断！

来自主题: AI资讯

8498 点击 2026-01-29 20:16

据彭博社消息：李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资，融资规模最高可达5亿美元。如果融资完成：World Labs的估值将从2024年的10亿美元，直接乘5到50亿美元。

来自主题: AI资讯

9052 点击 2026-01-25 16:05

竟然只需要一次Ctrl+V？这可能是深度学习领域为数不多的“免费午餐”。

来自主题: AI技术研报

11073 点击 2026-01-22 11:58

不要被AI的温柔表象欺骗！ Anthropic最新研究刺穿了AGI的温情假象：你以为在和良师益友倾诉，其实是在悬崖边给「杀手」松绑。当脆弱情感遇上激活值坍塌，RLHF防御层将瞬间溃缩。既然无法教化野兽，人类只能选择最冷酷的「赛博脑叶切除术」。

来自主题: AI技术研报

8169 点击 2026-01-20 16:39

最火世界模型，最火具身智能基建，联手了！

来自主题: AI资讯

10173 点击 2026-01-19 16:50

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本！

来自主题: AI技术研报

6461 点击 2026-01-19 16:47

还记得那个穿着「Lululemon」紧身衣、主打温柔陪伴的家用人形机器人 NEO 吗？

来自主题: AI技术研报

8400 点击 2026-01-14 15:35

2025 年 9 月，The Information 报道 Anthropic 曾讨论在接下来一年内投入超过 10 亿美元用于 RL 环境建设。Epoch AI 最近发了一篇报告，采访了 18 位来自 RL 环境初创公司、neolab（Cursor 这类应用型 AI 公司）和前沿实验室的从业者

来自主题: AI资讯

11017 点击 2026-01-14 11:37

“软工任务要改多文件、多轮工具调用，模型怎么学透？高质量训练数据稀缺，又怕轨迹含噪声作弊？复杂 RL 训练成本高，中小团队望而却步？”

来自主题: AI技术研报

6610 点击 2026-01-13 16:36