AI资讯新闻榜单内容搜索-RL

无需标注图像，VLM也能「自我进化」！RL自我进化框架VisPlay突破视觉推理难题

在 Vision-Language Model 领域，提升其复杂推理能力通常依赖于耗费巨大的人工标注数据或启发式奖励。这不仅成本高昂，且难以规模化。

来自主题: AI技术研报

10030 点击 2025-12-02 15:22

空间智能再进化！Spatial-SSRL帮助LVLM更好读懂空间

本文第一作者为刘禹宏，上海交通大学人工智能专业本科四年级学生，相关研究工作于上海人工智能实验室科研实习期间完成。通讯作者为王佳琦、臧宇航，在该研究工作完成期间，均担任上海人工智能实验室研究员。

来自主题: AI技术研报

6857 点击 2025-11-30 15:05

世界模型：机器能否理解现实？

人工智能研究的最新目标，尤其是在追求“通用人工智能”（AGI）的实验室中，是一个被称为“世界模型”（world model）的概念：这是一种AI内部携带的环境表征，就像一个计算型的雪球玻璃球。AI系统可以借助这个简化的内部模型，在真正执行任务之前，先对预测和决策进行评估。

来自主题: AI技术研报

8833 点击 2025-11-30 11:18

丢下那桩年入 500 万美金的好生意丨100 个 AI 创业者

对初创公司来说，Superlinear（指数引力）的第一个业务 Deeplink 堪称成功：去年成立，今年的 ARR（年经常性收入) 就达到 500 万美元；且已经实现盈利。但创始人于北川并不打算在这个业务上继续重点投入，而是带领核心团队，全力转向了一款新产品 Lessie AI。

来自主题: AI资讯

9272 点击 2025-11-28 13:51

浅谈一下RLVR&SFT分别对模型显性知识学习和隐参数空间结构扰动背后的一些猜想

最近不论是在学术圈还是产业实践中，对于RLVR和传统SFT之间的区别与联系，以及RL本身基于奖励建模反馈机制并结合不同的策略优化算法过程中对模型显性知识的学习和隐参数空间的变化的讨论热度一直很高。

来自主题: AI技术研报

7276 点击 2025-11-26 09:12

Meta再推WorldGen，简单一句话，竟「盖」出50×50米一座城

Meta 用一段文本构建可探索的 3D 世界。这就是 Meta 最新公布的一项突破性研究 WorldGen：只需一段文本提示就能生成真正可导航、可交互、可以走进去探索的完整 3D 世界。

来自主题: AI资讯

10262 点击 2025-11-22 15:29

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

7805 点击 2025-11-22 11:31

Z Tech ｜ LMSYS 团队发布大规模 MoE 强化学习框架 Miles，不积跬步无以至千里

继轻量级强化学习（RL）框架 slime 在社区中悄然流行并支持了包括 GLM-4.6 在内的大量 Post-training 流水线与 MoE 训练任务之后，LMSYS 团队正式推出 Miles——一个专为企业级大规模 MoE 训练及生产环境工作负载设计的强化学习框架。

来自主题: AI资讯

9553 点击 2025-11-20 15:26

如视发布空间大模型Argus1.0，支持全景图等多元输入，行业首创！

近来，世界模型（World Model）很火。多个 AI 实验室纷纷展示出令人惊艳的 Demo：仅凭一张图片甚至一段文字，就能生成一个可交互、可探索的 3D 世界。这些演示当然很是炫酷，它们展现了 AI 强大的生成能力。

来自主题: AI资讯

1714 点击 2025-11-19 20:06

NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测

人类高级视觉皮层在个体间存在显著的功能差异，而构建大脑编码模型（brain encoding models）—— 即能够从视觉刺激（如图像）预测人脑神经响应的计算模型 —— 是理解人类视觉系统如何表征世界的关键。传统视觉编码模型通常需要为每个新被试采集大量数据（数千张图像对应的脑活动），成本高昂且难以推广。

来自主题: AI技术研报

11019 点击 2025-11-19 15:21