
具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能
具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操作任务,显著提升了空间智能和任务泛化能力。
Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操作任务,显著提升了空间智能和任务泛化能力。
国产机器人,再次惊呆了歪果仁。这便是深圳众擎机器人最新发布的视频。视频中的机器人名叫PM01,身高1.38米,体重约40公斤,全身24个自由度。可以看出,不论是起跑、跑步过程以及停跑,各个关节的协调几乎是没有了“机器人味儿”。
微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。
刚填完坑就又埋下“惊喜预告”??
一贯匆匆的人群罕见地汇聚在了一起,用手机、相机层层包围着一个正在独立行走的人形机器人,不断有人上前靠近打卡。稍后,这个来自深圳当地具身智能企业“众擎”的机器人,凭借灵活自然的行动,让相关视频在社交平台上广为流传,甚至引得英伟达工程师在X平台上感叹,“这是真的吗,还是Sora或者什么生成的?”
波士顿动力公司刚刚发布了Atlas机器人的新视频,这位曾经以跑酷和空翻闻名的「网红」,如今竟然走进了工厂,开始认真从事零件排序工作!这标志着Atlas从「炫技」到「实用」的重大转变。
新趋势、新业态
傍上中国移动和华为两个“大哥”, 乐聚人形机器人迎来“智变”。
AGI的成熟度是一步一步提升的。
本文提出了一种轨迹级别 SE (3) 等变的扩散策略(ET-SEED),通过将等变表示学习和扩散策略结合,使机器人能够在极少的示范数据下高效学习复杂操作技能,并能够泛化到不同物体姿态和环境中。