魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令人和智能体共享奖励参数,这才是强化学习正确的方向?
搜索
人和智能体共享奖励参数,这才是强化学习正确的方向?
在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。
高质量数据枯竭,传统预训练走向终点,大模型如何突破瓶颈?
大家还记得那个 ICLR 2025 首次满分接收、彻底颠覆静态图像光照编辑的工作 IC-Light 吗?
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。
港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。
北京大学陈宝权教授团队提出RainyGS技术,通过结合物理模拟和3D高斯泼溅渲染框架,实现了真实场景中动态雨效的高质量仿真与呈现,真正实现「从真实到真实」,或者「以仿真乱真」,即Real2Sim2Real !相比现有的视频编辑工具(如 Runway),其物理真实性获得保证。
无监督学习训练整数规划求解器的新范式来了。
AI 圈永远不缺「新活」。
GPT-4o图像生成架构被“破解”了!