ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
人形机器人为何一夜爆火?
6897点击    2024-10-17 10:26

布局人形机器人,车企走在最前头。



不久前的特斯拉「We, Robot」发布会上,Tesla Bot 走出工厂,真正进入人们的生活。当晚的 After Party 上,头戴绅士帽的 Tesla Bot 在吧台后给观众边倒饮料边聊天,场外的 Tesla Bot 和观众玩猜拳游戏,即便不小心竖起了中指,整个场面仍然是相当科幻和震撼的。


这应该是 Tesla Bot 首次规模化的应用展示,而这距离特斯拉首次发布人形机器人刚刚过去 2 年时间。



恰好也是 2022 - 2024 的两年时间,人形机器人企业雨后春笋般出现,特别是汽车企业争先恐后入局,资本市场异常活跃。根据相关统计,仅在今年上半年,国内机器人领域已经披露的融资金额就已经超过 70 亿元。相比之下,去年全年国内机器人行业的融资金额约 50 亿元,今年基本会翻一番。 


同时,国内更不乏已经投入应用的产品。优必选已经进入极氪等多个汽车工厂成为了打工人;宇树科技推出了人形机器人的量产版,并且发布了 9.9 万元的价格;不久前举办的世界机器人大会上,上百家企业齐聚,各家产品普遍都能出来「走两步」了。


两年时间,已经有几十年历史却从未走进人们生活的人形机器人怎么就突然大火?这背后离不开最有号召力的 CEO 之一埃隆·马斯克的极力推动。他在今年 5 月面向投资者说,未来 Tesla Bot 的数量可能是 100 亿、200 亿甚至更多。


这是夸下海口,哄投资者开心吗?或许还真不是。


一方面,电动汽车、自动驾驶、AI 大模型,过去十年最火热的技术,人形机器人集于一身。而这几项技术,特斯拉早就是「老油条」了。


另一方面,成本大幅降低。马斯克最新预测 Tesla Bot 的价格是 2 - 3 万美元,相比汽车更便宜。而在此之前太长的时间里,人形机器人硬件成本只能用百万级来计算。


是不是有点像自动驾驶了?原来没有端到端,车也都是百万级。如今,成本低到可以取网约车司机而代之。


很显然,人形机器人的火热的背后,就是过去十多年创新技术的一次集中展现。


01 人形机器人概念并不新鲜


在自动驾驶-元宇宙-AI 大模型之后,人形机器人就是 2024 年最火热的技术前沿。然而,这并不是盘古开天辟地般的全新技术,科幻电影里早就有了,小规模应用也已经有好几十年。


1959 年,在通用汽车新泽西工厂的压铸车间里,一台名为 Unimate #001 机械臂正式启用。它的作用是将刚刚铸造好的门把手等零部件投入冷却液中,然后传递给工人。到了 1961 年,通用汽车引入了 Unimate 1900 系列,在很短时间里,超过 450 台 Unimate 机械臂进入了通用汽车的压铸车间。



不过,当年通用汽车甚至都没有对外公布这条消息,原因是高管团队担心这种试验性的技术会引来风险。这或许是人形机器人的雏形,它刚好代替了人的手,帮工人降低烫伤的风险。


到了 1972 年,早稻田大学的 WABOT 项目做出了世界上第一款人形机器人 WABOT-1,它有四肢、可对话、还能测定距离和方向。WABOT 项目的网站上还专门提到,WABOT-1 的能力大概是一岁半的婴儿。



在此之后,人形机器人在日本迎来了一次爆发。日立、本田、富士通、索尼、东京大学……纷纷推出了人形机器人,大多都用于家庭陪伴的场景。其中,本田可能是做得最好的那一家。


1986 年,本田的双足机器人 E0 诞生。它以人为模型,但只有下半身,并具备 6 个自由度。从 1987 年到 1993 年,本田推出 E1 - E6 共六款双足机器人,都是 12 自由度的产品。单边腹股沟六款产品的路线是先走快(从 0.25 km/h 提升到 4.7 km/h),然后突破障碍物,E6 甚至可以自己爬楼梯。



1993 年,本田的第二代机器人 P 系列诞生,相比 E 系列更像人了,因为它终于拥有了双手。但这回本田保持了低调,直至 1996 年下代产品 P2 诞生,才同时公布了两款人形机器人。


到了 2000 年,本田的第三代人形机器人 ASIMO 诞生。它曾经在纽交所敲过钟,走过电影首映式的红毯,还在迪士尼乐园巡游,在音乐会当过指挥,IBM 还租过一台放在日本的办公楼里,可以说露脸的机会大大增加,甚至都在讨论 ASIMO 量产的事情了。


不过,说研发都能开开心心,一到量产直接惊掉下巴。


最初版本的 ASIMO 身高 1.2 米,行走速度 1.6 km/h,体重 54 kg,共有 26 个自由度,续航 30 分钟。在 IBM 办公楼里,ASIMO 可以欢迎来访人员,并带领访客到会议室。简单来说,这是个前台工作人员的秘书。



然而,本田制造它的成本不到 100 万美元,IBM 每月需要付大约 15 万美元的租金。


想象一下,究竟是怎样的老板会为公司前台配一个秘书,并且每月工资 15 万美元?当然,这并不是说 IBM 的老板花的全是冤枉钱,毕竟这也是公司形象的展示。但这个形象展示的成本,的确不低。


2011 年,本田推出 ASIMO 的第三代产品,也是最后一代。它身高 1.3 米,体重 48 公斤,步行速度可以达到 2.7 km/h,也能一路小跑,速度达到 9 km/h。到这一代产品,综合续航也提升到了 1 小时。不过,本田在 2018 年停止开发和生产 ASIMO。


2020 年 12 月 30 日,波士顿动力发布了新年快乐视频,人形机器人 Atlas 跳了一段不到三分钟的舞蹈直接破圈。因为从这开始,人形机器人进入了下一个时代,能走路、能跑跳,最重要的是很难再摔跤了。



甚至在特斯拉「WE, ROBOT」发布会之后,还有不少网友到这条视频下留言嘲讽 Tesla Bot。



说到特斯拉的人形机器人,它的落地还是相当快的,2021 年 PPT,2022 年展示了第一版动态模型,2023 年 12 月发布第二代产品,2024 年进入特斯拉工厂成为「打工人」。在「WE, ROBOT」发布会上,Tesla Bot 能编队行走,能一起跳舞,还会和人类进行交流对话,玩猜拳游戏、祝福生日快乐、制作饮料……都难不倒它。



而在技术上,Tesla Bot 又是一次革新,车内已经成熟的电池、电机技术,广泛应用的 AI 芯片,二者技术复用度相当高,换句话说,成本大幅降低。



马斯克最新估计 Tesla Bot 的价格是 2 - 3 万美元,比入手一辆特斯拉还要便宜。成本的降低,或许就是量产之前最后的一道门槛。


显然,马斯克要把 Tesla Bot 量产的执念,给整个行业打了一剂强心针。在此之前,整个行业都以研发为主,高昂的成本导致没有公司敢于量产。


同时,AI 技术的不成熟,机器人与人的交互基本为 0,应用范围也受限制……这些因素注定让人形机器人在过去几十年时间里成为少数人的玩具,或者形象上的加分项。而这样的现实,2022 年之后悄然发生改变。


02 这次轮到了中美两国的竞争


2022 年 11 月,OpenAI 发布 ChatGPT,并采用了 GPT-3.5 模型。ChatGPT 可以生成类似人类的对话形式,并且用户可以调整长度、格式、风格等等。一时间,生成式 AI 成为科技圈最热门的话题。


恰好,传统机器人最不擅长的交互,生成式 AI 就能帮助解决,无论是手势还是语言,同样的摄像头和麦克风配合本地和云端的 AI 能力,曾经存在的问题可以像弯道超车一般解决掉。与此同时,在过去 10 年,新能源汽车已经走向成熟,电机、电池、AI 芯片、软件都是现成可复用的产品。


人形机器人距离量产越来越近了!


但是,日本企业似乎已经掉队了。一方面,日本企业几乎没有电动汽车和自动驾驶领域的积累。另一方面,鲜有优秀的 AI 大模型。


人形机器人轮到了中美两国的竞争。


四足和桌面机器人的探索


2016 年,被谷歌 X 收购的波士顿动力发布了四足机器狗 Spot,这或许是认知度最高的机器狗。当年,波士顿动力也展示了第一代双足机器人 Atlas。但很明显,当时业内对机器狗更买账,此后 Spot 的出镜率明显更高。


同样是 2016 年,还是打工人的王兴兴辞去工作,获得天使投资,创立了宇树科技。此后,这家公司推出了多款四足机器狗。


另一家布局较早的公司是 2012 年成立的优必选,到 2014 年,优必选成功研发并生产了小型机器人 Alpha,主攻教育市场。


2021 年,小米甚至也拿出了四足机器狗产品,名叫 CyberDog 铁蛋。


一时间,成本低、体积小、技术开源的四足机器狗成为了行业的主流产品。一方面,成本可控。另一方面,应用场景广泛,机器狗可以在人无法到达的危险场景下工作,或者直接转化成为军事装备。然而,当大家都在做四足机器人的时候,马斯克的一张 PPT 悄然改变了这一现实。


人形机器人的爆发


2020 年,现代汽车集团从软银手中收购了波士顿动力大约 80% 的股份,波士顿动力几次易主,如今成为现代汽车的子公司。2021 年,优必选发布新一代 Walker S 人形机器人。当年的特斯拉 AI Day 上,马斯克宣布了人形机器人设想,并展示了关键参数(还是模型和 PPT 阶段)。从这之后,人形机器人迎来了爆发,一时间,创业型企业、人形机器人产品层出不穷。



2022 年 8 月,小米发布了 CyberOne,进军双足机器人。当年 10 月,特斯拉亮相了初代 Tesla Bot。2023 年 3 月,Open AI 与 Figure 发布了 Figure 01,内置 OpenAI 的大模型。2023 年 8 月,智元机器人发布远征 A1,这是华为天才少年稚晖君创业智元机器人后亮相的首个重磅产品。


而到了 2024 年,更多创企拿出了自己的产品,例如逐际动力、星海图、加速进化、星尘智能、银河通用等,整个行业迎来大爆发。


实际上,爆发的不仅仅是产品,资本市场同样看好人形机器人。根据相关统计,仅仅在今年上半年,国内机器人行业融资达到了 69 起,融资总额累计大约 75 亿元。相比之下,去年全年国内机器人行业共有 32 家企业获得融资,累计约 50 亿元。可以说,今年的融资规模相比去年几乎翻了一番。


更有意思的是,汽车企业居然成为了人形机器人行业投资与自研的排头兵。北汽、上汽、比亚迪、小鹏、广汽都有布局。


其中,北汽产投今年已经投资两家机器人公司,分别是银河通用和帕西尼感知。今年 4 月,帕西尼感知宣布获得 A+ 轮融资,投资方之一就是北汽产投。今年 6 月,银河通用完成 7 亿元天使轮融资,投资方也包含北汽产投。


上汽集团的布局更广一些,今年智元机器人和逐际动力两家公司三次获得上汽旗下投资机构的投资。今年 3 月,智元机器人关联公司上海智元智元新创技术有限公司发生工商变更,新增股东红杉中国、M31 资本、上汽投资,三家共同参与智元机器人 A++++ 轮融资。今年 7 月,逐际动力完成 A 轮战略融资,投资方之一为尚颀资本,即上汽集团金融平台上汽金控旗下私募股权投资机构。到今年 9 月,逐际动力发生工商变更,新增上汽旗下河南尚颀汇融尚成一号产业基金合伙企业等三家公司机构成为股东。同时,注册资本由约 193.42 万人民币增至约 209.35 万人民币。


实际上,获得上汽投资的智元机器人早在去年还获得了比亚迪的投资。去年 8 月,上海智元新创技术有限公司获得比亚迪投资,比亚迪认缴出资额 191.497 万,当时持股比例接近 3.76%。



几大自主品牌车企除了广泛投资之外,自研也都安排上了。去年举行的小鹏汽车科技日上,小鹏首次展示了自研的人形机器人 PX5。第二代人形机器人也会在今年即将到来的 1024 科技日上亮相。


今年 4 月,广汽集团宣布,正结合智能制造、汽车后市场服务、智慧生活等领域,与全球头部企业携手,探索人形机器人未来光明的应用场景。


还有业内消息指出,理想汽车从去年起就在考察机器人行业。


不仅仅是汽车行业,互联网厂商、科技公司早就入局,今年人形机器人行业的大额融资同样不少。


例如,已经发布量产人形机器人的宇树科技今年获得近 10 亿元 B++ 轮融资,9 月再次完成数亿元人民币 C 轮融资,可以说是今年国内人形机器人创企的融资之王。


宇树科技 G1 已经发布了量产版,身高 1.32 米,售价 9.9 万元起。宇树科技 G1 的头部集成了多种感知设备,一颗览沃 MID360 激光雷达,英特尔 RealSense D435 深度相机,以及麦克风阵列,和人一样,有了观察和倾听的能力。同时,G1 也集成了扬声器,用于和人类的交互。



G1 全身可以实现 23 - 43 个自由度,其中,G1 的膝关节可以爆发出最大 120 N·m 的扭矩,这让 G1 实现跑、跳,以及蹲下站起的能力。


除了宇树科技之外,其他大额获得大额融资的人形机器人公司几乎都成立于 2023 年。


星动纪元在今年年初拿到了超亿元的天使轮融资,投资方包括联想创投;10 月 16 日完成近 3 亿元 Pre-A 轮融资,清流资本、元璟资本、阿里巴巴联合领投,策源资本跟投,老股东联想创投、世纪金源、金鼎资本、泽羽资本、清控天诚持续追投,华兴资本继续担任本轮独家财务顾问。 ‍

‍ ‍ ‍ ‍ ‍ ‍

星海图今年已经完成了三次融资,天使轮融资规模数千万美元,之后获得北京机器人产业投资基金的天使+ 轮融资,今年 9 月再次获得高瓴资本、米哈游、无锡创投的 A 轮融资,后两次融资未公布具体金额。

加速进化今年完成了天使+ 轮、Pre-A 两轮融资,第一次数千万元人民币,第二次亿级人民币。


松延动力今年 3 月和 6 月分别完成天使轮和 Pre-A 轮融资,两次交易金额都未披露。


成立于 2022 年 12 月的星尘智能也在今年获得数千万美元 Pre-A 轮融资。


可以说,2024 年过去的 10 个月中,人形机器人的创业型企业、研发、产品、投融资都处于爆发的状态,极速扩张。甚至,人形机器人的终点早就被规划好了,比人类数量还多,可以帮人类做大多数的事情。

不过就算到今天,真正量产落地的人形机器人仍然屈指可数。


人形机器人逐渐落地


说到落地,目前人形机器人最好的应用场景还是工厂,尤其是汽车工厂。这就以特斯拉 Tesla Bot、优必选 Walker S、Figure 01、Apptronik Apollo 为代表。


在特斯拉 2024 年 Q2 财报中,一张 Tesla Bot 在工厂里分拣 4680 电池的照片非常醒目,这意味着特斯拉机器人在发布两年、迭代一次之后,终于找到了自己的工作,荣幸地成为了一名打工人。



而到了特斯拉「WE, ROBOT」发布会上,Tesla Bot 成群亮相,跳舞、倒酒、猜拳、唱生日歌……样样都会。在马斯克的规划中,Tesla Bot 之后会走出工厂,进入人们的家里,甚至乘坐 Robovan 成为特斯拉远程救援机器人。



回到国内,率先在汽车工厂「找到工作」的人形机器人是优必选 Walker S。早在 2012 年,优必选已经成立,开始研发、设计机器人,当时研发的产品都面向教育市场。从 2016 年开始,优必选开始人形机器人的布局,Walker 第一代在 2018 年发布。2021 年发布 Walker X,并实现了商业化。2023 年 12 月,优必选在港交所上市,最新一代人形机器人 Walker S 敲响开市锣,产品更适合用于工业场景。


优必选刚刚发布的全新一代工业人形机器人 Walker S1 已进入比亚迪工厂实训,并且还能和 L4 级无人物流车、无人叉车、工业移动机器人和智能制造管理系统的协同作业。



优必选的 Walker S1 体型明显更大,身高 1.72 米,体重也来到了 76 公斤。Walker S1 的头部集成了双目鱼眼相机,类似人眼一样的 3D 立体视觉感知,关节部位的最大扭矩达到 250 N·m。在 Walker S1 的手部,6 个阵列式触觉压力传感器,可以在搬运、分拣时精准操控。



不久前举行的世界机器人大会现场,优必选就展出了 Walker S 系列人形机器人在执行智能搬运、智能分拣、智能质检等任务的能力。


到目前,优必选已经和东风柳汽、吉利汽车、一汽红旗、一汽-大众、奥迪一汽、比亚迪等汽车企业,3C 企业富士康、物流企业顺丰在内的多家企业合作,Walker S 正式进厂成了打工人。在工厂内可以完成智能搬运、智能分拣、智能质检、螺丝拧紧、零件安装、化学品操作等多种任务。


相对其他人形机器人企业更早的布局,优必选产品的落地速度几乎就是最快的那一个。


今年,Figure 和宝马、Apptronik 和奔驰达成合作,Figure 01 进入宝马美国工厂装配零件,Apptronik Apollo 进入奔驰匈牙利工厂工作。



很明显,在这波人形机器人的浪潮之中,中美两国科技企业共同发力,目标就是商业化,进入工厂、进入家庭生活。然而,我们距离人形机器人的商业化,似乎还有一定的距离。甚至,我们正过于乐观地预测人形机器人的未来。


03 还没到 Model 3 时刻


2008 年,特斯拉基于路特斯 Elise 底盘打造的 Roadster 开启交付,但在那个燃油车如日中天的时期,加上还是初创公司的第一辆车,Roadster 叫好不叫座。



经过 2012 年的特斯拉 Model S、2015 年的 Model X、2017 年的 Model 3 之后,特斯拉被整个市场认可。特别是 Model 3,让特斯拉从一家曾被汽车行业「不太看好」的公司,成为电动汽车市场的 TOP 1。


Model 3 的发布,恰好就是一个关键节点。有如 2007 年乔布斯发布 iPhone,Model 3 对于汽车行业来说就是革命性的。不过,人形机器人领域还远远没到 Model 3 的时刻,现在更像是 Roadster 的阶段,下一步就看 Model S 的了。


在 2023 年的世界机器人大会上,已经有相当多的人形机器人展出。一年之后的 2024 世界机器人大会,最明显的变化其实是机器人从普遍不能走到了普遍能走的阶段,或者说,业内的产品已经从 PPT 到 Demo 了。


也正因为人形机器人还在 Demo 阶段,其产品层面的问题就是亟待解决的。


如果聚焦人形机器人的硬件,续航时间短、硬件成本高、动作缓慢等就是显性问题。而站立不会摔倒似乎已经是这个行业的准入门槛,更高级的产品早已会跑酷。


例如,导致人形机器人续航时间短的原因一方面是机器人体内放不下太大的电池模组,而更大的原因是腿部的功耗非常高,通常可以达到几百瓦的功率。虽然这和人保持站立的姿势更累是一个道理,但这直接导致人形机器人即便什么都不干,站 2 - 3 个小时就会「累得倒下」。也正因此,目前有许多机器人公司只做机器人手部,腿部则是用 AGV 底盘,一方面省电,另一方面省去了腿部的复杂算法,商业化难度一下降低不少。


动作缓慢同样是巨大的问题,目前无论是工厂搬运,还是生活场景,目前人形机器人的速度就是《疯狂动物城》中的闪电。看完一倍速的人形机器人在工厂干活的视频,有评论说,「它的工资一定是按小时计算的,不按工作量计算」。


而这些问题,随着硬件技术的进步,相信会逐渐解决,就像是人们对电动汽车各方面的焦虑越来越低一样。


人形机器人在软件层面似乎更为初级。目前可以看到的趋势是通过机器人的摄像头、麦克风、触觉感知等像人一样感知世界,再利用 AI 大模型实现各种功能。


但实际上,目前人形机器人的 AI 应用几乎都在手部,它知道拿一个鸡蛋和一条毛巾分别应该用怎样的力度,但你要让机器人帮你拿来身后第二个房间左边的桌子上的一张报纸,它可能还真完成不了这个任务,原因就在于腿和手可能就不在一个频道上。


人形机器人双腿的任务是不摔倒,根据指令和标志导航到规定的位置。这类似基于高精地图的自动驾驶,最重要的能力是人类已经建模完成的地图,否则无法实现自动驾驶。而面向未来的落地场景,手和脚需要有更紧的联动关系。


另外,人们对人形机器人的能力有相当强的期待,甚至它应该是全能的「人类」。人类会做的事情它会做,人类去不了的地方、不会做的事情,它也会。这种广泛的通用性对于现在的人形机器人行业来说还是个巨大的挑战,只会做几件事,还不知道怎么学习的机器人,用户一定是不满足的。


除了产品层面的问题,伦理层面的问题似乎更难解决。


如今,有不少公司竭尽所能,将人形机器人造得极为像人,以此减少人形机器人对人类生活的入侵感。当然更多公司尽可能把人形机器人造得更科幻,因为这本就不是人,而是机器。不知道大家怎么看这两种选择?


同时,马斯克对人形机器人未来的设想更为超前。他预测未来每个人都会有人形机器人,甚至不止一个,因此这个地球上可能有 100 亿,甚至 200 亿个机器人。如此多数量的人形机器人,人类的工作会被广泛替代。


恰好,随着 L4 级自动驾驶的落地,网约车、出租车司机的态度已经打了个样。由此看,人形机器人的规模落地,或许比我们想象中还要更为困难,这也是人形机器人远远未到 Model 3 时刻的原因。


04 写在最后:内卷尽头?


最近,苹果 Apple TV+ 平台原创剧 Sunny 播出,故事背景就是日本社会广泛采用人形机器人后,人形机器人自主出现暴力倾向,之后被黑帮组织修改程序导致混乱。


同时,人形机器人确实为人们带来相当大的便利。在剧中,机器人让宅家几年的人走出家门、可以帮助人类做大多数事情、危急时刻还能保护人类。或许这是编剧所想象到人形机器人的最终形态,也可能是你我对人形机器人行业终点的判断。



不久前,36 氪 CEO 冯大刚在一次公开演讲中说:「(机器人行业)有点像 AI 行业的早期,大家都存一种对 AI 的狂热,这种狂热导致他把自己的一些设想当成了行业的最终形态。


马斯克显然更为乐观,不过不知道是否为口误,短短半年时间,马斯克竟然就给人形机器人「涨了一回价」。今年 5 月他预测的价格是 1 - 2 万美元,而到了 10 月他预测的价格是 2 - 3 万美元。


即便是 3 万美元的价格,对于工业场景来说也是极低的成本。在中国,这或许就是一名生产线工人一年的工资。人形机器人可以在比人类标准更高、007 的工作时间、没有情绪的前提下工作,其在工业场景下的产出理论上远高于人类。


而对于人类而言,人形机器人更像是人类内卷的「终结者」。


文章来自于“42号车库”,作者“James”。