硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了
7109点击    2026-04-30 12:14

美西时间4月28日,具身智能行业有史以来,第一场全球性峰会在硅谷落幕!


这场大会星光熠熠——


2015年图灵奖得主、公钥密码学奠基人Martin Hellman做开场主旨演讲,主题是「安全、智能与物理世界的交汇」。


英伟达GEAR Lab高级研究科学家、亚马逊前沿AI研究院科学家、斯坦福大学副教授同台对谈,上千名来自全球的AI学者、开发者和投资人到场。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


张艺兴也惊喜现身


在这场名为GEIS(全球具身智能创新大会)的峰会上,一口气发布三款核心产品,覆盖世界模型、灵巧手和人形机器人。


如此豪华的阵容,硬核的发布,倒像是硅谷本土巨头的画风。


谁能想到,GEIS的发起方竟是一家成立刚满两年的中国公司——魔法原子(MagicLab)。


在硅谷办会、请图灵奖得主站台,具身智能赛道还从未有过这种先例。


机器人缺的不是胳膊腿,是脑子


过去两年,人形机器人的关节扭矩越来越大,自由度越来越多,翻跟头的姿势越来越花。


但一个尴尬的事实始终没变,绝大多数机器人离开预设好的demo场景,就「不会干活」了。


问题出在哪?


目前主流的VLA(视觉-语言-动作)大模型已经能让机器人听懂指令、看见场景,但一旦进入真实环境,光照变了、桌面材质换了、物体摆放位置偏了几厘米,泛化能力就开始崩。


说到底,机器人缺的不是更强的胳膊腿,是一个真正能理解物理世界的「大脑」。这才是核心瓶颈。


这正是魔法原子此次发布的世界模型Magic-Mix要解的题。


世界模型Magic-Mix,自己教自己


Magic-Mix由两个核心引擎协同运作。


第一个叫Magic-Mix WAM,负责物理环境理解、空间推演和动作决策。


通俗地说,它让机器人在动手之前,先在「脑子里」模拟一遍接下来会发生什么。


抓一个杯子,手指接触杯壁的瞬间会产生多大的力?杯子的重心在哪?如果桌面是湿的,摩擦系数怎么变?


这些物理常识层面的推演,是VLA模型不擅长的,而世界模型恰好补上了这块。


第二个引擎叫Magic-Mix Creator,是一个离线数据生成器。


它的工作是大批量合成训练数据样本,持续喂给WAM做训练和迭代。


以上两个引擎组合在一起,形成了一个闭环,海量数据生成→模型训练→训练结果反馈→数据再生成。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


换言之,Magic-Mix是一个能「自我进化」的动态系统。


机器人在真实场景中每执行一次任务,产生的数据都会回流到这个闭环里,驱动模型持续进化。


在训练机制上,Magic-Mix有一个很硬核的设计,视频动作双专家协同训练。


一个专家负责「看」,从视频数据中学习物理世界的运行规律;另一个专家负责「动」,把观察到的规律转化为具体的动作策略。


两个专家共享底层信息,但梯度更新彼此隔离,避免互相干扰。


这套机制还引入了目标图像约束和失败图像特征输入。系统不仅学习「成功长什么样」,也学习「失败长什么样」,从而在执行长线程任务时减少误差累积。


而支撑这套系统运转的底层基础,是数据。


数据,恰恰是当前具身智能最大的瓶颈。真机数据采集成本高、周期长、场景覆盖有限,这是全行业面临的共性难题。


魔法原子给出的解法是「两条腿走路」——


一方面,大力投入真机数据采集。日均采集约16000条,VLM层模型参数量达3B,已积累约36万条真机数据;


另一方面,通过Magic-Mix Creator大批量合成训练数据,实现万倍级别的数据体量扩展。


其构建的Robot Data Pool,高质量数据集规模已超100万小时。


这套「真机采集+合成扩展」的数据飞轮,大幅降低了对纯真机数据的依赖,也为模型训练提供了持续稳定的弹药补给。


从行业视角看,谁能率先跑通数据闭环,谁就能在具身智能的下半场占据先机。


一个可以想象的场景是,如果这套世界模型率先在家庭环境中跑通,机器人就能在厨房里根据台面上食材的摆放位置自主规划切菜、装盘的动作序列,而不需要人类预先编排每一步。


从水龙头出水的角度到碗碟叠放的高度,这些细碎的物理变量都在世界模型的推演范围内。


家庭这种高度非结构化的场景都能应对,工业产线上相对标准化的任务就更不在话下。


这是世界模型真正的战略意义:它是为所有场景提供底层能力支撑。


谁先把世界模型跑通,谁就拿到了具身智能规模化落地的「万能钥匙」。


灵巧手H01,比人手还「敏感」


有了「大脑」的决策能力,还需要足够精密的执行终端。


会上,同期发布的新一代灵巧手MagicHand H01,有几个参数值得单独拎出来看。


20个自由度,其中15个为主动自由度,整机重量仅1公斤,额定负载却达到10公斤。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


机器人的手越重,对整机负载的挤压就越大,留给实际作业的有效载荷就越少。


H01把自重压到了1公斤,几乎不吃整机的负载预算。


44个高分辨率三维触觉传感器覆盖手掌和指尖,力感知分辨率达到0.05牛顿。


要知道,人类指尖的力感知阈值大约在0.05到0.1牛顿之间。H01在力感知精度上,已经摸到了人手的下限。


但H01最有辨识度的能力是「未触先觉」。产品具备0到40mm的动态感知范围,接近觉分辨率达到0.5毫米,能够在真正接触物体之前就完成动作预判。


配合5mm级的硬件闭环响应系统,机器人的手在离物体还有几厘米的时候就已经开始调整姿态和力度了。


这在护理、康复训练、家庭服务这类场景中尤其关键。机器人跟人近距离接触时,靠碰撞检测做事后补救太晚了,H01能在接触发生之前就完成力度和轨迹的调整。


1秒内完成完整开合动作,响应速度足以应对工业产线节拍。同时支持适配市面上多款人形机器人本体,不绑定自家平台。这个开放策略在灵巧手赛道并不常见。


更具实用价值的是,H01被设计为通用模块,可适配市面上多款人形机器人本体。


这是一个明确的生态化信号:魔法原子不只想给自家机器人配上灵巧手,而是想让H01成为行业的「标准件」。


MagicBot X1,7×24小时不下班


三款产品中的最后一块拼图是旗舰人形机器人MagicBot X1


上一代Gen1,身高174cm、42个自由度、双臂搬运负重20公斤,是魔法原子在春晚和工厂产线上验证过的主力机型。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


而这一次,X1在Gen1基础上做了几个关键升级。


第一是运动能力大幅提升。


X1身高拉到180cm,体重70kg,全身31个主动自由度(Gen1是42个总自由度,但主动自由度数未公开披露),极限关节扭矩从Gen1的体系升级到450N·m。


整机运动速度综合提升30%以上,运动范围提升超过50%。


更高的扭矩和更大的运动范围组合起来,意味着X1能在更复杂的空间姿态下完成作业。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


举个栗子,工业场景中经常需要机器人弯腰探进设备内部做检测或取件,这类动作对躯干和肩关节的运动范围要求很高,Gen1在某些极限角度下会受限。


X1提升50%的运动范围,直接拓宽了它在柔性生产场景中的适用面。


第二是续航问题的根本解法。


Gen1综合续航最高5小时,对于需要两班倒,甚至三班倒的工业场景来说不够用。


X1没有选择堆更大的电池,而是做了双电池热插拔系统,支持不断电更换电池,直接实现7×24小时连续作业。


工厂不需要等机器人「下班充电」,运维人员换块电池就行。


这个设计思路比单纯拼电池容量更务实。


第三是产品化程度。


X1一共有两个SKU:开箱即用「标准版」,以及面向高校和开发者「科研版」,支持底层二次开发和外形定制。


Gen1在产品化层面更偏向定制项目交付,X1从一开始就是冲着标准化量产去的。


到这里,技术拼图闭环了。Magic-Mix世界模型是「大脑」,H01灵巧手是「双手」,X1人形机器人是「身体」。


从感知、决策到执行,一口气补齐。


行业拐点已至,谁在真正落地?


站在更宏观的视角来看,GEIS上大会上的集中发布折射出的是,整个具身智能行业正在经历的结构性转折。


年初,智源研究院在发布的《2026十大AI技术趋势》中指出,具身智能正迎来行业「出清」,中国已有超过230家具身智能企业,其中人形机器人企业超过100家。


但这一轮竞争的技术难度、资金需求远超过往,当前企业数量远超赛道的物理承载量与资本供给能力。


换言之,2026年,是具身智能从「百团大战」走向「诸侯割据」的分水岭。


谁能从实验室走向量产交付,谁能打通从技术到产品再到商业的完整链路,谁就能在洗牌中存活并胜出。


从这个角度审视魔法原子的GEIS发布,其战略意图更加清晰——


世界模型提供理解世界的能力,灵巧手提供精细操作的能力,人形机器人提供全场景作业的身体平台。


而「闭环」,恰恰是此次GEIS硅谷发布会的核心叙事。


全栈自研+全球押注


支撑这套闭环的底层,是魔法原子硬件自研率超过90%的全栈路线。


自研关节模组峰值扭矩525N·m,专利布局超150项,自建数据采集工厂日产真机数据16000条。


这条路线的代价是研发投入大、周期长,但回报也摆在那里。


成立两年内,从春晚百台群控、苏超近300台户外暴雨群控到香港论坛4.5小时零故障商务服务,连续完成了一条跨场景验证链。拿下大健康领域1.5亿元单笔订单。业务覆盖全球50个国家和地区,海外收入占比超过60%。


GEIS大会上,魔法原子总裁顾诗韬首次对外披露长期目标——


2036年冲刺140亿美元营收,未来五年投入10亿美元打造全球开发者生态。


硅谷这一夜,属于中国机器人!图灵奖得主、英伟达大牛全来了


大会现场与硅谷AI企业Openmind、PrismaX AI、Cosmicbrain AI、Physis完成签约,基于「千景共创」计划向生态伙伴开放硬件样机、开发资金和核心技术支持。


当全球具身智能行业还在为「大脑」和「身体」谁先谁后争论不休时,魔法原子选择了一条更朴素也更难走的路径——


两手都要抓,两手都要硬。


这家从江苏走出来的公司,正在硅谷用一场发布会向全球宣告:中国具身智能的全栈时代,已经到来。


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI