AI资讯新闻榜单内容搜索-泛化能力

ICCV 2025 Highlight | 3D真值生成新范式，开放驾驶场景的语义Occupancy自动化标注!

本文介绍了来自北京大学王选计算机研究所王勇涛团队及合作者的最新研究成果 AutoOcc。针对开放自动驾驶场景，该篇工作提出了一个高效、高质量的 Open-ended 三维语义占据栅格真值标注框架，无需任何人类标注即可超越现有语义占据栅格自动化标注和预测管线，并展现优秀的通用性和泛化能力，论文已被 ICCV 2025 录用为 Highlight。

来自主题: AI技术研报

8951 点击 2025-08-29 11:42

手把手教机器人：斯坦福大学提出RTR框架，让机械臂助力人形机器人真机训练

人形机器人的运动控制，正成为强化学习（RL）算法应用的下一个热点研究领域。当前，主流方案大多遵循 “仿真到现实”（Sim-to-Real）的范式。研究者们通过域随机化（Domain Randomization）技术，在成千上万个具有不同物理参数的仿真环境中训练通用控制模型，期望它能凭借强大的泛化能力，直接适应动力学特性未知的真实世界。

来自主题: AI技术研报

8862 点击 2025-08-27 11:05

打工半年后，Atlas觉醒！「大行为模型」零代码上新技能，AI工业革命来了？

Atlas进厂打工技能再进化！波士顿动力联手丰田研究院，首次让人形机器人Atlas能够通过语言指令驱动，一次性处理从折叠配件到整理仓架的复杂作业。这种LBM（Large Behavior Models，大行为模型）方法让机器人具备跨任务泛化能力，迈出了工业化实践的一大步。

来自主题: AI资讯

9740 点击 2025-08-22 11:20

CoRL 2025｜隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

在机器人操作任务中，预测性策略近年来在具身人工智能领域引起了广泛关注，因为它能够利用预测状态来提升机器人的操作性能。然而，让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战，尤其是生成高质量的像素级表示。

来自主题: AI技术研报

8813 点击 2025-08-18 11:53

专访星海图赵行：热闹的Demo不等于泛化能力，具身智能胜负仍在数据量

人头攒动的2025WRC（世界机器人大会）上，不乏各种酷炫的Demo展示，可在一众敲锣打鼓的机器人表演中，具身智能公司星海图展位上，机器人却在安静地执行铺床任务。

来自主题: AI资讯

8008 点击 2025-08-13 12:43

1句话高质量生成游戏3D动作，北大新方法刷新动画制作SOTA

北京大学提出了ReMoMask：一种全新的基于检索增强生成的Text-to-Motion框架。它是一个集成三项关键创新的统一框架：（1）基于动量的双向文本-动作模型，通过动量队列将负样本的尺度与批次大小解耦，显著提高了跨模态检索精度；（2）语义时空注意力机制，在部件级融合过程中强制执行生物力学约束，消除异步伪影；（3）RAG-无分类器引导结合轻微的无条件生成以增强泛化能力。

来自主题: AI技术研报

10041 点击 2025-08-09 11:32