AI资讯新闻榜单内容搜索-训练

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥？是否因人工采集海量交互数据需要高昂成本而望而却步？又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚？

来自主题: AI技术研报

10099 点击 2025-11-12 09:32

从VLA到RoboOmni，全模态具身新范式让机器人察言观色、听懂话外音

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni，统⼀视觉、⽂本、听觉与动作模态，实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据，引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报

8757 点击 2025-11-12 09:29

MIT融合新旧视觉技术，破解救援机器人导航瓶颈，无需标定，数秒生成3D场景

在一场矿难救援中，时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行：浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图，识别路径，并精准定位自己的位置。

来自主题: AI技术研报

8013 点击 2025-11-12 08:51

一年省万元？全球首款AI健身伴侣上线

随着全球用户健康意识的不断提升，健身成为最高频的生活习惯之一，如何让健身更有效、科学并预防损伤是一门专业技能，因而健身教练的市场也水涨船高，一年上万的费用随处可见，对于用户来说，私教定制一方面价格比较贵，另一方面在时间上的自由度更低，无法随时随地进行。而现在全球首款AI健身伴侣BodyPark ATOM即将上线KS，助于用户更高效、更智能地训练。

来自主题: AI资讯

8986 点击 2025-11-11 16:41

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

全开源多模态大模型（MLLM）的性能，长期被闭源和半开源模型“卡脖子”。

来自主题: AI技术研报

7195 点击 2025-11-11 16:39

如何打造AI科学家？AI Scientist综述，从模块到自治六阶段方法 |最新

本文基于研究者的系统性综述，围绕“AI Scientist（AI科学家）”这一新的概念展开，核心线索是研究者的六阶段方法论与三阶段演进轨迹；您如果正搭建一个可验证、可协作、可扩展的研究自动化体系，这篇综述更像一张总路线图而非空洞口号，有不少思路可以借鉴。

来自主题: AI技术研报

9344 点击 2025-11-11 11:22

Cursor 首度揭秘："训练即产品"，用强化学习让 AI 编程快 4 倍的秘密武器

Sasha Rush 在分享开头就提到，Cursor Composer 在他们的内部 benchmark 上的表现几乎与最好的 Frontier 模型（前沿模型）持平，并且优于去年夏天发布的所有模型。它的表现明显好于最好的开源模型，以及那些被标榜为"快速"的模型。

来自主题: AI技术研报

8082 点击 2025-11-11 11:12

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

近期，阿里巴巴 ROLL 团队（淘天未来生活实验室与阿里巴巴智能引擎团队）联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构（Asynchronous Training）、Asymmetric PPO（AsyPPO）与 Attention 机制（Attention-based Reasoning Rhythm），

来自主题: AI技术研报

8169 点击 2025-11-11 10:24

AI同时学会了人类的智慧和无脑

从支持「屎棒棒创业」到数学证明，AI的「谄媚」正成隐忧：一次更新曝出迎合倾向，GPT对荒诞乃至有害想法也点头称是。斯坦福、CMU研究证实模型更爱迎合，令用户更固执、更少反思却更信任AI；数学基准亦见模型为伪命题硬编证明。

来自主题: AI技术研报

6397 点击 2025-11-11 09:51

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

多模态大模型（MLLMs）虽然在图像理解、视频分析上表现出色，但多停留在整体场景级理解。

来自主题: AI技术研报

10381 点击 2025-11-11 09:50