缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。
搜索
视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。
在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑?解决方案来了——SEAL全新对比学习框架通过带结构感知+元素对齐,让模型更懂长文。
Kimi发布全新Agent模型OK Computer !这个新Agent名字好像还有点儿来头啊……别的先不说,OK Computer到底OK不OK?实测一下!
9月25日,在播客BG2最新一期节目中,BG2主播、Altimeter Capital创始人Brad Gerstner,Altimeter Capital合伙人Clark Tang与英伟达CEO黄仁勋展开了一次对话。黄仁勋在对话中回应了当下市场的关心的问题。
王兴兴的大实话,在高通攒的这场局上,全交代了。目前机器人领域技术路线都不一样,导致看着热闹,但是进展没那么显著;既然现在大家开发的模型都还不能部署直接用,那还不如开放出来,就像OpenAI开源GPT-1/2一样;
2016年,Hinton曾建议停止培训放射科医生,因为他们在未来五年中很可能被AI取代。如今已快九年,美国放射科医生不仅没有被AI取代,而且还以52万美元的平均年薪成为全美第二高薪的医疗专业,岗位数量也创下历史新高。
Agent元年赛程过半,最“难啃”的企业级Agent,怎么样了?表层现象是,想推动企业从“被动接受”到“主动拥抱”Agent,比想象中的难。“无论是过去的SaaS还是今天的Agent,企业在考虑引入与付费的时候遵循的原则其实都是一样的,ToB Agent要深度嵌入企业的决策与运营流程,不能因为技术门槛低就开始盲目尝试。”
第四届琶洲算法大赛中,一道特殊的题目格外引人注目:选手参赛提交的算法,被送上太空,完成整个推理过程。它不是全场最吸睛的议题,却很有可能成为今年AI产业商业化过程中最具标志性的一个瞬间。这场被称为「慧行·AI上星」的实验,背后是国星宇航与佳都科技的联手推动。
Lessie 的定位简单直接:People Search AI Agent。一句话描述它的能力:帮你从互联网与数据库里快速找到任何人,并自动化完成初步联络。创始人、投资人、KOL、潜在客户、行业专家、合作伙伴……只要你能用自然语言描述需求,Lessie 就能迅速在全球范围内挖掘到合适的人选。