半年估值翻6倍!亚马逊与OpenAI联手投机器人AI大脑。
AI初创公司Physical Intelligence今天宣布已筹集4亿美元新资金,该公司主要通过AI模型为机器人打造“大脑”。
本轮融资由亚马逊创始人兼执行董事长 Jeff Bezos 、Thrive Capital和Lux Capital领投,参与该轮融资的其他投资者包括明星AI创企 OpenAI 、Redpoint Ventures和Bond。
本轮融资后,Physical Intelligence的估值约为 24亿美元 ,相较于3月份种子轮时期的4亿估值,其估值在短短半年时间内翻了 6倍 。
Physical Intelligence联合创始人兼首席执行官Karol Hausman曾是 谷歌机器人科学家 ,公司成员多数来自加州大学伯克利分校和斯坦福大学的研究团队、特斯拉、谷歌DeepMind和X等知名企业。
公司主要致力于为机器人打造一个 通用AI模型 ,帮助机器人理解物理世界,从而完成复杂任务。
“我们所做的不仅仅是为任何特定机器人设计一个大脑,而是打造一个可以控制任何机器人的通用大脑。”Karol Hausman表示。
现阶段,行业内的机器人基本都是专业型机器人,大多只能完成一项任务或一系列简单的动作。它们可以适应环境中的细微变化,但无法轻松适应极其混乱或复杂的空间环境,例如家庭或工厂等。
但公司认为人工智能可以改变这种机器人困境,让机器人学习并遵循用户的指令,只需告诉机器人想要做什么,机器人就可以自己想办法适应环境。
该公司打造了一个名为“pi-zero”的通用机器人基础模型。该AI模型可以让用户简单直接地告诉机器人去执行任务,沟通方式就如与聊天机器人助手对话一样。
Physical Intelligence利用pi-zero展示如何微调AI模型,就能让机器人折叠衣物、冲咖啡、收拾桌子和组装箱子。
机器人的每一个动作都需要AI将其拆解为更细致的过程。
比如说在收拾桌子时,机器人必须识别垃圾和餐具之间的区别,它必须将垃圾扔进垃圾桶,同时将餐具放入收拾托盘。然后,它需要将盘子上的垃圾捡起,还需要学会在将盘子放入托盘之前将垃圾扔掉。
创建通用模型的最大挑战是目前缺乏大规模多任务和多机器人数据。机器人数据集的增长,将有助于为更强大的机器人大脑。
与LLM不同的是,pi-zero模型需要涵盖从文本、图像、视频到物理智能等更广泛数据类型。尤其是像物理智能,也就是机器人移动四肢、抓取物体、操纵物体或采取其他行动的具体行为,这类数据往往更难获取。
Physical Intelligence还表示,打造机器人大脑不仅需要更多高质量数据,更需要整个机器人社区的共同努力。
它也和多家公司和机器人实验室进行了合作,将使用合作伙伴的数据进行预训练模型,同时改良硬件设计。
“我们相信,这只是朝着开发真正的通用机器人模型迈出的一小步。”就像LLM是语言的基础模型一样,通用机器人模型为物理智能提供了基础AI。
现阶段,具身智能行业内有不少创企都瞄准了机器人AI大脑细分方向,各类机器人控制通用模型也层出不穷。比如说,70亿参数开源模型OpenVLA、930亿参数模型Octo等。
据介绍,Physical Intelligence提到自家的pi-zero模型在大多数复杂任务上的表现都优于OpenVLA和Octo。
除了创企,一些科技巨头也同样关注到这一方向的潜在空间。
去年,谷歌的研究人员推出了一款搭载5.62亿参数的PaLM模型-E的机器人,该机器人可以理解基本的单声道命令,例如拾取和递送物体。
英伟达也在今年宣布了Project GR00T——一款用于双足人形机器人的通用基础模型。
可以看出,随着AI应用的爆发,不少企业都看到具身智能潜在的市场空间。具身智能行业内对机器人AI大脑的关注度和投资热度也正在上升,这一细分领域正成为具身智能发展的重要方向。
文章来自于“硅兔君”,作者“Cora Xu”。
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner