独家对话前华为天才少年李元庆:首款规模化具身智能产品中国造!多机异构是未来方向

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
独家对话前华为天才少年李元庆:首款规模化具身智能产品中国造!多机异构是未来方向
6657点击    2026-01-05 09:54

独家对话前华为天才少年李元庆:首款规模化具身智能产品中国造!多机异构是未来方向


刚刚,AI 前线获悉,前华为天才少年、原华为云具身智能核心负责人李元庆已正式加入乐享科技,后续将重点负责乐享科技的创新业务战略规划与核心技术攻关。


2024 年,李元庆出任华为云具身智能主要负责人及 ROBO_AGENT 负责人,牵头完成多款具身智能机器人核心方案开发,其中由他主导的 2024 年华为 HDC 大会明星具身智能项目成功落地并引爆网络,成为具身智能技术走向大众视野的标志性案例,也让他成为行业内具身智能领域的顶尖人才之一。


据了解,此次李元庆选择加入乐享科技,核心原因在于双方在具身智能赛道的技术理念高度契合。


近期,我们对李元庆进行了独家专访。透过 2025 年具身智能领域在技术及落地表现上的各类突破性进展,他道出了这一年来具身智能技术栈的核心演变。在与我们的对话中,李元庆也直言不讳地指出当下制约具身智能大规模落地应用的同质化难题,以及他对此的技术路线选择与思考。


“世界上第一款能大面积铺开的具身智能落地产品,很可能会在中国出现。多机异构技术路线是具身智能未来的发展方向。”李元庆称。


在他看来,这个时代下具身智能领域最该抓住的就是两件事:落地和数据。而他接下来的核心发力点是,打造一款面向家庭用户的功能性产品。


以下是完整对话内容,以飨读者。


机器人更“抗造”了,

关键技术突破多点爆发


Q:我们观察到,2025 年无论是科技巨头还是初创公司,都显著加大了对具身智能的投入,还有许多新投身进来的创业者,顺利拿到大额融资的亦不少。在您看来,这股热潮背后的核心驱动因素是什么?技术成熟度的变化还是市场应用预期?


李元庆:机器人企业大多能顺利拿到投融资,这已经成为一种普遍现象。当下,机器人领域依然是值得入局成立公司的赛道,这一点我是确信的。资本市场看待这个领域遵循的是长期逻辑,大家已经明确看到了未来的发展结果。一款优质的硬件产品需要花费数年时间去梳理供应链、等待技术逐步成熟,整个产业发展也需要一个漫长的周期。所以在我看来,当前机器人领域的热潮,本质上是由未来的确定性倒推而来的结果。


这波热潮有个特别典型的特征,就是一二级市场的联动。现在二级市场的头部上市企业,之所以纷纷布局机器人领域,有几方面的原因。首先是出于公司市值管理的需求,很多上市公司会对外释放信号,如 “今年我们要切入人形机器人赛道”,并且会把这项技术整合到自身的应用产品线中,这相当于为公司打造了一条未来的第二增长曲线。


所以,从二级市场的角度来看,布局机器人领域有几个核心价值:一是能为传统制造业链条赋能,让投入产出比变得更划算;二是助力市值管理,打造第二增长曲线,用传统制造业的资金去撬动机器人这个高市盈率的新兴科技赛道;三是可以盘活现有团队,给员工提供二次赋能的机会,拓展更多的工作内容。而且中国市场本身带有很强的政策导向性,这也是一二级市场能够快速联动的重要原因。


另一个核心原因是技术成熟度的突破。我接触过不少国内的人形机器人项目,最明显的对比就是去年和今年的差异。和 2024 年相比,现在的机器人在稳定性、可靠性上都有了显著提升,能明显感觉到机器人正从技术演示阶段朝着产品化的方向推进。以前这些机器人还只是实验室里的 demo,现在已经逐渐变成可以推向市场的产品了。


客观来说,2024 年的人形机器人稳定性很差,轻轻推一下基本就会倒;要是突然给它加一个额外的大力矩,或者地面稍微打滑、不平整,它都会很容易倒地。但 2025 年在各类展会上,像宇树等企业的机器人已经有了明显进步,现在的机器人越来越 “抗造”,踢一脚不会倒,摔一下也不会倒,脚打滑了也能稳住,动作还变得更流畅,甚至能完成跳舞、打武术这类复杂动作。这些表现,都是机器人软硬件在局部运动控制层面成熟度的直观体现。这种技术层面的突破,给了整个行业和资本市场很大的信心。


Q:2025 年具身智能领域有哪些突破性进展让您印象深刻,包括技术、产业化和生态建设上?这些进展是否已经为具身智能从实验室走向特定场景的“初步普及”奠定了基础?


李元庆:有不少值得关注的突破,尤其是学术界跟进得比较紧密。第一是 LocoFormer 技术,能让机器人实现跨本体的局部运动控制,这个突破的价值非常大。第二是 AnyTracker 相关的应用,能让机器人像人的 “身外化身” 一样,紧紧跟着人做动作,远程操作时机器人也能精准复刻动作,时延和稳定性都做得很好,而且全程不会摔倒,这也是一项很突出的成果。


除此之外,还有一些明显的进展集中在局部运动控制领域,机器人的软硬件打磨得越来越成熟,也越来越产品化,开始能在更多场景中落地应用了。以前操作机器人需要大量工程师全程跟进,现在不一样了,就算不是专业工程师,只要会敲代码、甚至用遥控器就能操控机器人,让它完成各种动作。


核心是夯实了软硬件整体的鲁棒性。以前的机器人说白了就是个演示 demo,稍微一动就会倒,还很容易出现故障、损坏。现在的机器人安全性和可靠性都上来了,就算在人员密集的场景里活动,也不用担心它突然摔倒砸到人,风险大大降低。以前大家都得用围栏把机器人隔离开来,现在人们已经能更近距离地接触它了。而且从产业化角度看,以前机器人基本没有实际交付的案例,现在交付市场规模越来越大,已经能买到商用机器人了,成本也变得更加可控。


Q:大模型的快速发展,为具身智能的“智能”部分带来了哪些质变?


李元庆:2025 年的实质性进展不算特别多,但有一个突破非常关键:机器人已经具备了一些简单任务 100% 完成的能力。以前就算是简单任务,成功率顶多也就 60% 到 90%,现在能做到 100% 了。同时,其他复杂任务的成功率也在稳步提升。这些变化特别让人震惊,之前我们一直觉得 AI 很难真正落地,现在证明了具身智能是有机会走向实际应用的。


Q:具身智能的核心技术栈正在如何演变?2025 年有哪些值得关注的新范式或共识?


李元庆:首先,机器人的局部运动控制技术已经越来越成熟,也就是机器人如何行走这件事,基本朝着产品化落地的方向推进了,并且发展速度快得让人惊讶。另外,VLN(视觉语言导航) 策略也在慢慢收敛。现在一个很关键的突破是,机器人开始能理解规则、知道该往哪里走了。举个例子,以前让机器人从 A 点到 B 点,它只会径直走过去,但现在你告诉它中间有草坪不能踩,它就能绕开草坪走。这些没办法靠人穷尽编写的规则,现在可以通过大模型灌输给机器人,这是 VLN 技术栈越来越完善的一个重要体现。


再说说操作控制,这个领域的技术路径目前还没有收敛,大家都在做各种尝试,但有两个特别棒的进展:一是单点任务的成功率实现了突破,以前这类任务成功率最多也就 60%-90%,现在已经能做到 100%;二是多任务的成功率也在稳步提升。从这两点就能判断,机器人接下来是能够可靠、稳定落地的,具身智能也具备了这样的可靠性。


再说说其他的新范式和共识。世界模型算是一个新范式,但说实话还没有形成行业共识。技术架构方面也有新变化,以前大家基本都用 transformer 架构,现在慢慢出现了更多新的技术路径,比如 VG-EPA、VG-1/2,关注和探索这些新路径的科研人员也越来越多了。还有一个核心的技术范式变化,大家开始把 VLA 与 RL 结合起来用。以前大家更多关注 VLA,相对轻视 RL 路径,现在两者结合后,机器人能完成更复杂的任务了。比如在星海图、Dyna Robotics、字节等企业的实践中,机器人已经能完成穿鞋带、榨橙汁这类难度很高的任务,而且像榨橙汁的成功率在论文展示的场景里已经接近 100%,这些进展才真正让大家对具身智能的落地更有信心。


最后说说新的共识。之前我问过 Physical Intelligence 的 CEO,他对具身智能的探索有一个评价,简单来说就是“走一步看一步”。大家都不会去预测它最终的形态,但现在确实能看到越来越多落地的可能性,这算是对当前行业状态很真实的描述和评价。


基础模型困局:

世界模型成破局关键?


Q:世界模型被寄予厚望,被认为是实现高级推理和规划的关键。现阶段来看,它对机器人实际能力的提升体现在何处?之后还有哪些方面的潜力?


李元庆:按照“数据金字塔” 的逻辑来看,第一层是视频数据、网络数据;第二层是各类强化学习相关的策略应用;第三层才是真实机器人的实际部署。目前世界模型最核心的作用是,能极快、极大规模地生成金字塔第一层的有效数据,帮助构建大量有效的数据资产库,比如生成视频大模型、3D 高斯建模、3D 世界构建、视频生成等都在补充这一层的数据。核心原因是,现在具身智能模型往往需要百万级小时的视频数据,而这些数据如果靠实际采集获取,不仅成本高、性价比低,收集速度还很慢。世界模型或视频生成模型有机会把这部分数据构建工作做得更高效、成本更低,这是它们现阶段最实际的价值。


至于第二层,世界模型也有替代部分现有技术的潜力,比如替代一些物理仿真引擎,去模拟摩擦力学、动力学以及机器人的机械结构等。现有仿真引擎存在明显缺陷,在仿真环境里表现很好,可部署到真实机器人上时,虽然移动控制(Locomotion)问题能解决,但操作控制(Manipulation)的问题还没做好。目前这一层的效果还没完全显现,但世界模型让我看到了解决这个问题的希望。另外,世界模型对于构建基础模型非常重要。要补充的是,实验室里的数据和技术要走进所有人的家里,所以我更关注的是后续的落地。


Q:几乎所有专家都指出,高质量、大规模的物理交互数据稀缺是当前最大瓶颈。面对真实数据采集成本高昂的困境,仿真合成数据、人类视频数据等替代方案能走多远?“数据工厂”是可行的解决方案吗?


李元庆:首先,仿真合成数据这套方案肯定是有意义的。数据的核心价值在于多样性,模型学习过程中需要大量种类丰富的数据,但靠实地采集、真人采集或者真机采集,很多时候根本拿不到这么多元化的数据。仿真合成数据的意义就在于补充这种多样性,哪怕为此稍微牺牲一点精度也值得。这一点在数据金字塔的第一层尤其重要,我们用这些数据来训练基础模型,比如世界模型生成的视频数据、3D 相关数据等,都是为了构建基础模型所需的数据资产库。有了仿真合成数据,后续的技术探索才能推进;要是没有它,很多方向的探索可能都不成立,我们现在确实迫切需要这部分数据。到了第二层,仿真合成数据的意义会稍微弱一些,但依然有价值,它能帮助大家快速拿到测试结果、实现模型收敛。


数据工厂的核心是聚焦真机数据,主要服务于数据金字塔的第二层和第三层。核心原因是,很多非平稳振动相关的场景,仿真拟合是不准确的,这时就需要真机数据来补位。所以说,仿真合成数据和数据工厂这两套方案都有存在的意义,只是解决的问题不同:前者更多是为了支撑基础模型的训练,后者则是服务于后期的模仿学习等场景。要是想让数字人或者人形机器人的动作更像真人,往往还是需要在数据工厂里采集真人的动作数据。先拿真人内容做动画,再让数字人去模拟拟合,才能得到核心数据。所以现在动捕数据采集依然有很大的市场空间,这些工作也都是有实际意义的。


对于技术落地,行业里有不同的思路:有人坚信一个大模型就能解决所有问题,也有人觉得可以通过模仿学习来推进落地。而数据工厂,就是后一种思路下的解决方案。这些不同的技术路线其实都有其合理性,最终能走多远,关键要看我们什么时候能探索到基础模型的能力上限。


现在行业里的核心困境就是缺少优质的基础模型,而好的基础模型又离不开海量数据的支撑。仿真合成数据和人类视频数据能不能在这个环节发挥作用?我可以负责任地说,完全可以。至于能走多远,说实话,现在只能走一步看一步。因为训练基础模型的过程中,模型架构可能需要不断调整,数据配比也会持续优化,数据质量同样在逐步提升。目前,这项技术还远远没到能满足规模化应用需求的状态。


硬核拆解:机器人当下的多种落地难题


Q:当前的硬件如灵巧手、关节驱动、传感器等,在哪些方面最能满足机器人的技术需求?又在哪些方面构成了发展的主要制约?


李元庆:我分享几个观点,可能和大家平时听到的不太一样。首先,我认为球形关节是明确需要重点发展的方向;其次,耐磨材料、抗蠕变材料的研发也亟待突破;还有一个关键点,是非永磁体的高密度电机。大家可能更关注灵巧手、关节驱动和传感器,我们可以拆解开来看。


先说说灵巧手,目前学术界主要有六种技术路径,分别是腱绳传动、连杆传动、齿轮传动、软体驱动,还有传统驱动结合 AI 增强的混合方案。再说到关节驱动,现在行业里的普遍做法是用多个电机去模拟球形关节的功能,比如手腕部位经常需要用三个电机来替代一个球形关节,以此实现类似人类手腕的灵活度。传感器目前存在的核心问题是噪声、蠕变和热稳定性,在受热之后,传感器会出现各种不稳定的反应,这些都是机器人领域需要攻克的技术难题。


球形关节的优势很明显,用一个球形关节就能替代过去的三个电机,既能让机器人实现轻量化,还能大幅缩小整机尺寸,理论上也能显著降低成本。抗蠕变材料则是腱绳控制技术路线里的刚需,像 Optimus Gen 3 就采用了腱绳传动的方案,这类技术路线对抗蠕变材料的性能要求很高,而目前相关材料的发展还需要时间。


非永磁体的高密度电机的核心痛点是电机发热和热衰减,在今年的机器人马拉松大会,现场很多机器人都需要频繁喷雾降温。传统永磁体电机存在一个致命问题,磁铁在高温环境下磁性会减弱。这类电机的转子带有磁铁,一旦温度超过 70 度,就会出现明显的热衰减,磁性下降直接导致扭矩传导失效,电机就会 “没力气”。现在行业里也在探索一些新的技术路线,如轴向磁通电机、中向磁通电机,但这类电机的发展同样受制于几个核心指标:高能量密度、小尺寸,这些都是目前亟待突破的瓶颈。


回到传感器,我接触过很多传感器相关的研发。现状是,能达到精度要求的传感器已经有了,但成本降不下来,产量也没能实现规模化爬坡,还需要一段时间去完善。而且传感器还得面对电机发热带来的热干扰问题,这也是一个绕不开的挑战。总的来说,我对这个领域的思考主要集中在新材料研发和新型关节技术突破这几个维度。另外说到灵巧手,我个人更看好三指灵巧手的方案,像 SharpaWave、Wuji Hand 这些产品。还有一个很有意思的现象,不少手机厂商也在布局相关领域,但大家都面临同一个难题:小尺寸、高能量密度的产品,必然会伴随电机发热严重的问题。


Q:这些算得上是行业内的难题吗?现在优化的难度高吗?


李元庆:这几个方向目前都是行业难题。首先是材料和结构层面,现在既没有性能出色的耐磨材料、抗蠕变材料,也没有能提供足够扭矩的球形关节。就拿抗蠕变材料来说,现在大家尝试过钨丝绳、聚乙烯和一些复合新材料,但都存在明显短板,钨丝绳的成本太高,一米就要 100 块钱;聚乙烯虽然便宜,可反复牵拉之后很容易被拉长变形,所以这部分还需要在材料选型和结构设计上做更多创新。不过,高密度高能量电机领域已经有了突破,轴向磁通的电机慢慢成熟了,正在逐步爬坡。传感器方面,精度和成本和产量正在逐年提升。总的来说,这些难题都在逐步推进解决的过程中。


Q:目前为止,制约具身智能大规模落地应用难题还有哪些?


李元庆:首先是成本问题,这是个特别大的阻碍。现在很多技术其实已经越来越稳定可靠了,但核心部件的价格居高不下,比如一台高性能的工控电脑要几万块,一款优质的灵巧手基本也要上万、甚至三到五万的都有。成本降不下来,就没有场景愿意去接受和应用。第二个问题,是场景化的产品定义不清晰,这是个系统性的问题。就拿工厂场景来说,人形机器人的投入产出比、执行速度、精度以及最终的工作效率,都还没有算过账,很难体现出优势。现在市面上有一些陪伴类的玩具机器人,算是一种产品方向,但这类产品同样存在成本偏高的问题,没能给用户建立起清晰的产品价值感知。


还有一点,软硬件技术路径的结合没有完全收敛,不过现在已经慢慢能看到一些成果了。另外,模型架构和数据的飞轮迭代设计也没有做好整合, 有人在单独解决数据问题,有人在单独攻克模型问题,但大家既没有明确到底该用什么样的数据,也没有确定哪种模型架构是最优的。这又会引发供应链的问题,技术路线不清晰的情况下,供应链根本没办法做针对性的配套。比如电机,有人需要小尺寸的,有人需要大扭矩的,有人追求高能量密度,有人看重高性价比,需求五花八门,供应链很难去适配。


最后,产品完整生命周期的市场和运维体系没有建立起来。现在用户对机器人的价值感知本就模糊,既觉得机器人价格昂贵,又不知道买回去能具体做什么。就算买回去了,机器人还容易出故障,后续也没有完善的维修服务。这些都是制约机器人大规模落地的典型问题。


把家庭当工厂,

打造“多机异构”功能性产品?


Q:面对这样的机遇与挑战,您们在接下来这一年的战略重点和核心发力方向是什么?


李元庆:我们团队现在的发展势头不错,虽说还没到最头部的位置,但绝对是赛道里即将冲出来的一匹黑马。我们的核心方向可以举个例子来理解,假如你跟家里的机器人保姆说 “帮我拿一杯水过来”,它可能会追问你 “水放在哪儿?这里有可乐、雪碧、芬达,你想喝哪一个?要放到你常用的位置吗?要不要倒进杯子里?”,本质上是因为家庭环境的信息化程度不够。理想的状态是,机器人第一天可能需要问这些问题,但第二天就该记住。比如知道你是病人,会在固定时间提醒你吃药、递药,知道你喝水的习惯并主动提醒。这些功能的实现,都离不开家庭信息化的构建。


我们的思路是,把每个家庭都当成工厂来对待。这是一个倒推的逻辑:以前工厂实现智能化的前提,都是先完成信息化、再推进自动化,最后才是智能化。我们要做的是,先用先进的空间感知技术,分层、分段地搭建家庭的信息化体系,再结合成熟的自动化控制理论,把操作控制和导航技术整合进去,实现家庭场景的信息化和自动化。之后,再通过友好的人机交互接口来过渡到智能化。在机器人还不够智能的阶段,我们可以通过和它对话、给它投喂更多数据,让它逐步优化;同时借助情感交互的设计,让用户对机器人的 “不完美” 更有容忍度。


最终的目标是,打造一款面向家庭用户的功能性产品,这是我们接下来的核心发力点。我们判断,这个时代下具身智能领域最该抓住的就是两件事:落地和数据。只有做出真正的产品,才能实现技术落地,同时把数据低成本地回收、形成闭环。


Q:具身智能的未来,会是一个“通用智能体”统一天下,还是由大量“专用智能体”组成的生态系统?两种路径各自的支持逻辑是什么?


李元庆:说实话,这两种观点我其实都不太认同。先说说通用智能体统一天下这件事,现在 NLP 的 scaling law 上限大家其实已经看到了。在目前的技术架构下,模型存在两个天然的本质问题 :坍塌和遗忘。举个坍塌的例子,语料里有错误信息,模型很容易就会混乱,不知道哪个才是正确的。再就是遗忘,模型可能擅长数学时,语文能力就变差了;擅长英语时,语文又会退步。目前来看,这种上限是很典型的,所以很难出现一个什么都精通的 “天才” 通用智能体,至少在当下的软件架构里,这件事还存在很大问题。


专用智能体像以前的家电或者 IoT 设备,其实根本不需要所谓的 “智能”,比如扫地机器人,用状态机或者简单的环境模型就足够了。我更倾向的未来形态,有点像《机器人总动员》里的场景:不是一个无所不能的通用智能体,而是多个机器人协作的模式,比如瓦力、伊娃和那些小机器人。每个机器人都有自己擅长的领域,能把一件事做到极致,同时又具备一定的泛化性和多余自由度的机械结构特性,还拥有一些基础的智能,能够和其他机器人配合完成高动态、复杂场景下的任务。


支撑这个观点的逻辑,可以从自然和人类社会的规律来推论。从自然角度看,生态系统里从来不是只有某一种生物,而是有各种各样的动植物,体型有大有小,功能各有不同,这样才能构成稳定的生态。再看人类群体,有擅长力量的、擅长耐力的、擅长敏捷的,每个人的体型结构、肌肉分布都不一样,擅长的事情也不同。就像一个办公室里,不同工种的人思维逻辑、能力特长都有差异,就连 MBTI 人格都能分成 16 种。还有一个很有意思的推论角度:未来是靠一个人解决所有事,还是靠一群不同的人协作解决所有事?答案肯定是后者。我们做事的时候,往往都是找不同专长的人分工合作,才能完成更复杂的任务。


我相信多机异构技术路线才是具身智能未来的发展方向,核心就是多个不同类型的机器人协同工作。


“全球首款规模具身智能落地产品,

在中国诞生”


Q:除了直接销售机器人整机,具身智能未来的商业模式可能有哪些创新?


李元庆:其实现在已经能看到一些新的模式了,并且都已经在逐步落地且都形成了清晰的小闭环。


最典型的是 RAAS(Robot as a Service,机器人即服务),这种模式是把机器人硬件当成服务的一部分,按使用次数或者完成的任务量收费。比如在工厂场景,按机器人完成的工序次数计费;中央厨房里面,按穿串、加工食材的任务量收费;机器狗、无人机按送货次数或者演出场次收费,这些都是很成熟的落地形式。


还有租赁模式,很多人会按天、按月或者按年租赁机器人。举个例子,科研实验室的机器人,周六日或者放假的时候基本闲置,但这段时间恰恰是商场需要机器人跳舞表演的高峰期,就可以通过租赁的方式盘活这些闲置设备,现在闲鱼上其实已经能看到这类服务了。


另外还有一种模式,是软件费加服务费的组合。不少公司会把机器人整机以极低的成本价出售,整机相当于 “低价入口”,核心利润来自软件授权和后续的服务费,通过 OTA 升级软件包的方式持续收费。Tech 1x 就是这么做的,它以 2 万美金的价格让人形机器人进入家庭。虽然现阶段机器人的智能化还不够完善,但可以先让用户建立产品感知,同时借助低价劳动力远程操控机器人完成家务。更重要的是,还能通过这种方式回收家庭场景的数据,用大模型训练,相当于用低价换取市场和数据,形成商业闭环。


Q:2026 年,全球具身智能公司的竞争情况将如何变化?中国公司与国际巨头各自的优势和赛点分别会在哪里?


李元庆:首先可以参考两个行业共识:山姆·奥特曼(Sam Altman)认为 AI 的决定性因素按优先级排序是人才、场景、数据、算力、模型;黄仁勋则提出人工智能 “五层蛋糕理论”,包括能源、芯片、基础设施建设、模型和应用。结合这些维度来看,全球竞争的格局其实很清晰。国际巨头的优势很突出,在算力、芯片以及模型的软件算法研究上比中国有一定领先,能虹吸全球人才、人才密度更高,初创公司的融资规模和金额也比国内大很多倍。


而中国的优势则集中在能源、硬件制造和市场活力上。更核心的是,中国是世界上最强大的 “建造者”,拥有极强的落地和工程能力,制造业链条完备,能快速把技术转化为产品,这是我们长期以来的核心竞争力。


2026 年的竞争中,双方的赛点各有侧重。对中国公司来说,核心赛点在于产品落地与数据闭环。模型的优化离不开数据,而产品是最快拿到大量真实且低成本数据的方式,不是靠花钱买数据,而是让产品走进用户场景,通过实际使用沉淀数据,再反哺模型迭代。虽然目前中国在资金链条和人才密度上不如北美,但我们的传统优势就是先让产品落地、抢占场景、实现数据回流。就像互联网时代那样,正是因为有了成熟的落地场景、数据闭环和现金流,才能吸引海外人才回流。所以早期阶段,尽快推动产品和场景落地是关键。


到了后期,中国的优势会更明显:我们的基础设施建设和能源建设在全球都是独一份的强。当下这个阶段,除了加速落地,还要尽量减少人才流失和资源错配,集中力量推进。我相信,世界上第一款能大面积铺开的具身智能落地产品,很可能会在中国出现。


Q:对于投身于具身智能领域的创业者和年轻科研人员,您会给他们什么建议,以在这个快速变化且资源密集的领域中找到自己的立足之地?


李元庆:我想先说一句话:快速变化的时代永远都是好事。这个时代虽然充满了风险,但更多的是机会,这是我的真实感受。现在整个具身智能赛道正处在蓬勃发展的成长期,不管是产品定义、用户感知的构建,还是软硬件技术路径、模型架构与数据飞轮的迭代设计,目前都还没有明确的答案。技术路线不清晰,供应链自然也很难配套部署。同时,产品完整生命周期的市场和运维体系也还没搭建起来。这些复杂的系统问题,既带来了很多风险,也蕴藏着大量的机会。


所以如果有人想加入具身智能领域创业或者从事相关的工作、科研,现在绝对是最好的时机,这是一个能够改变未来的赛道。而且现在大家基本都还在同一条起跑线上,彼此的差距并没有拉开太多。我想给的建议就是,找到自己真正热爱的方向,大胆去尝试,用极高的执行速度快速迭代。分享一句强化学习里大家常用的策略:test early,fail fast,learn faster(尽早测试、快速试错、更快学习)。在充满不确定性的赛道里,这样做往往能找到最优解,至少也是局部最优解。


总而言之,大胆尝试、快速执行,哪怕失败也没关系,关键是要基于失败的经验快速调整。这个领域里,处处都是机会。


技术人的年度仪式感!#InfoQ 年度盘点与趋势洞察 启动!


《2025 年度盘点与趋势洞察》由 InfoQ 技术编辑组策划。覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。


力求以体系化视角帮助读者理解年度技术演化的底层逻辑、创新方向与落地价值,并为新一年决策提供参考。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。


文章来自于“AI前线”,作者 “蔡芳芳、华卫”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales