ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI机器人初创获4亿美元融资,亚马逊和OpenAI参投
5486点击    2024-11-06 09:11

半年估值翻6倍!亚马逊与OpenAI联手投机器人AI大脑。


AI初创公司Physical Intelligence今天宣布已筹集4亿美元新资金,该公司主要通过AI模型为机器人打造“大脑”。 


本轮融资由亚马逊创始人兼执行董事长 Jeff Bezos 、Thrive Capital和Lux Capital领投,参与该轮融资的其他投资者包括明星AI创企 OpenAI 、Redpoint Ventures和Bond。 


本轮融资后,Physical Intelligence的估值约为 24亿美元 ,相较于3月份种子轮时期的4亿估值,其估值在短短半年时间内翻了 6倍 。 


Physical Intelligence联合创始人兼首席执行官Karol Hausman曾是 谷歌机器人科学家 ,公司成员多数来自加州大学伯克利分校和斯坦福大学的研究团队、特斯拉、谷歌DeepMind和X等知名企业。 



公司主要致力于为机器人打造一个 通用AI模型 ,帮助机器人理解物理世界,从而完成复杂任务。

 

“我们所做的不仅仅是为任何特定机器人设计一个大脑,而是打造一个可以控制任何机器人的通用大脑。”Karol Hausman表示。 


01


难适应工作环境?


PI打造机器人通用大脑


现阶段,行业内的机器人基本都是专业型机器人,大多只能完成一项任务或一系列简单的动作。它们可以适应环境中的细微变化,但无法轻松适应极其混乱或复杂的空间环境,例如家庭或工厂等。


但公司认为人工智能可以改变这种机器人困境,让机器人学习并遵循用户的指令,只需告诉机器人想要做什么,机器人就可以自己想办法适应环境。


该公司打造了一个名为“pi-zero”的通用机器人基础模型。该AI模型可以让用户简单直接地告诉机器人去执行任务,沟通方式就如与聊天机器人助手对话一样。



Physical Intelligence利用pi-zero展示如何微调AI模型,就能让机器人折叠衣物、冲咖啡、收拾桌子和组装箱子。 


机器人的每一个动作都需要AI将其拆解为更细致的过程。 


比如说在收拾桌子时,机器人必须识别垃圾和餐具之间的区别,它必须将垃圾扔进垃圾桶,同时将餐具放入收拾托盘。然后,它需要将盘子上的垃圾捡起,还需要学会在将盘子放入托盘之前将垃圾扔掉。

 

02


机器人不够聪明?


PI:喂养的数据不够优质


创建通用模型的最大挑战是目前缺乏大规模多任务和多机器人数据。机器人数据集的增长,将有助于为更强大的机器人大脑。


与LLM不同的是,pi-zero模型需要涵盖从文本、图像、视频到物理智能等更广泛数据类型。尤其是像物理智能,也就是机器人移动四肢、抓取物体、操纵物体或采取其他行动的具体行为,这类数据往往更难获取。



Physical Intelligence还表示,打造机器人大脑不仅需要更多高质量数据,更需要整个机器人社区的共同努力。


它也和多家公司和机器人实验室进行了合作,将使用合作伙伴的数据进行预训练模型,同时改良硬件设计。


“我们相信,这只是朝着开发真正的通用机器人模型迈出的一小步。”就像LLM是语言的基础模型一样,通用机器人模型为物理智能提供了基础AI。 


03


创企与巨头携手


推动具身智能新浪潮


现阶段,具身智能行业内有不少创企都瞄准了机器人AI大脑细分方向,各类机器人控制通用模型也层出不穷。比如说,70亿参数开源模型OpenVLA、930亿参数模型Octo等。 


据介绍,Physical Intelligence提到自家的pi-zero模型在大多数复杂任务上的表现都优于OpenVLA和Octo。 



除了创企,一些科技巨头也同样关注到这一方向的潜在空间。 


去年,谷歌的研究人员推出了一款搭载5.62亿参数的PaLM模型-E的机器人,该机器人可以理解基本的单声道命令,例如拾取和递送物体。 


英伟达也在今年宣布了Project GR00T——一款用于双足人形机器人的通用基础模型。 


可以看出,随着AI应用的爆发,不少企业都看到具身智能潜在的市场空间。具身智能行业内对机器人AI大脑的关注度和投资热度也正在上升,这一细分领域正成为具身智能发展的重要方向。 


文章来自于“硅兔君”,作者“Cora Xu”。


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner