AI资讯新闻榜单内容搜索-R1

一年后，DeepSeek-R1的每token成本降到了原来的1/32

几天前，DeepSeek 毫无预兆地更新了 R1 论文，将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容，包括首次公开训练全路径，即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline，以及「Aha Moment」的数据化验证等等。

来自主题: AI技术研报

8704 点击 2026-01-10 17:02

毫无征兆！DeepSeek R1爆更86页论文，这才是真正的Open

两天前，DeepSeek悄无声息地把R1的论文更新了，从原来22页「膨胀」到86页。DeepSeek向世界证明：开源不仅能追平闭源，还能教闭源做事！

来自主题: AI技术研报

9424 点击 2026-01-08 11:44

2025具身智能行业年度盘点：从先锋亮相到理性前行

具身智能是2025年的最大的“泡沫”吗？年初，宇树突然放大招，发布了5900美元的R1人形机器人。要知道，就在一年前，业内普遍认为人形机器人的成本底线还在2到3万美元，宇树这一招，相当于把整个行业的价格预期直接打碎。

来自主题: AI资讯

9525 点击 2025-12-29 08:56

深度｜OpenAI最高职级华人Mark Chen独家回应与Gemini竞争、Meta人才战及AI核心策略

我们不会和 Meta 竞价，即便待遇远低于对方，核心人才仍愿意留在 OpenAI，只因大家坚信这里的发展潜力和 AGI 愿景。

来自主题: AI资讯

10356 点击 2025-12-25 10:15

最鲁棒的MLLM！港科大开源「退化感知推理新范式」 | AAAI'26

多模态大语言模型（MLLMs）已成为AI视觉理解的核心引擎，但其在真实世界视觉退化（模糊、噪声、遮挡等）下的性能崩溃，始终是制约产业落地的致命瓶颈。

来自主题: AI技术研报

9358 点击 2025-12-25 09:44

807道灵魂拷问后，中国模型竟在「意义测试」中夺冠！

AI不仅会做PPT，写代码，它还能理解更深层次的问题。在美国的一项偏重于文化领域的新基准测试中，中国开源模型Qwen3夺冠，DeepSeek的R1跻身前六，力压多家全球顶级的明星模型。

来自主题: AI资讯

6298 点击 2025-12-23 10:06

RL加持的3D生成时代来了！首个「R1 式」文本到3D推理大模型AR3D-R1登场

强化学习（RL）在大语言模型和 2D 图像生成中大获成功后，首次被系统性拓展到文本到 3D 生成领域！面对 3D 物体更高的空间复杂性、全局几何一致性和局部纹理精细化的双重挑战，研究者们首次系统研究了 RL 在 3D 自回归生成中的应用！

来自主题: AI技术研报

9045 点击 2025-12-23 09:27

经验记忆黑科技：LightSearcher让AI工具调用减39.6%、推理快48.6%

如今，以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务，而DeepSearch 作为深度思考大模型的核心搜索器，在推理过程中通过迭代调用外部搜索工具，访问参数边界之外的最新、领域特定知识，从而提升推理的深度和事实可靠性。

来自主题: AI技术研报

7278 点击 2025-12-18 09:46

英伟达拿出推理版VLA：Alpamayo-R1让自动驾驶AI更会动脑子

当今自动驾驶模型越来越强大，摄像头、雷达、Transformer 网络一齐上阵，似乎什么都「看得见」。但真正的挑战在于：模型能否像人一样「想明白」为什么要这么开？

来自主题: AI技术研报

8708 点击 2025-12-02 09:19

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

9180 点击 2025-11-30 09:30