ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
机器人大模型新公司,数据规模比同行大1000倍,贝索斯、孙正义等押注
9011点击    2024-07-13 12:56

GPT-3 时刻正在进入机器人世界。


最近,Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。


无论是在物流、车厂试点的人形机器人,还是四足机器狗,都要有脑子。过去,脑子要定制,「专款专用」,现在,不必了。


最近,位于匹兹堡的机器人初创 Skild AI 声称,已经开发出一种通用的智能系统。它就像一个通用的智能模块,可以接入不同机器人,让他们立刻获得一些基本能力,如爬坡、跨过障碍、识别和捡起物品。

7 月 9 日,Skild AI 正式宣布筹集到 3 亿美元 A 轮融资,公司估值达 15 亿美元。投资人阵容也非常强大,涵盖科技界、顶尖风投甚至学术机构。


贝索斯和孙正义的软银都出现在领投名单中,他们均以长期投资视野著称。Lightspeed(领投)、Coatue(领投)、Sequoia、Menlo Ventures、General Catalyst 等都是全球知名的顶级风投,也出现在投资名单中。卡内基梅隆大学的参投也表明,Skild AI 技术得到学术界认可。


01 何方神圣?


Skild AI 由两位前卡内基梅隆大学教授 Abhinav Gupta 和 Deepak Pathak 于 2023 年 5 月创立,长期目标是开发扎根于物理世界的通用人工智能 ( AGI )。



前卡内基梅隆大学教授 Deepak Pathak(左)和 Abhinav Gupta(右)创立了 Skild AI,他们也曾是 Meta 的 AI 研究人员。



团队成员来自 Meta、特斯拉、Nvidia、亚马逊、谷歌以及卡内基梅隆大学、斯坦福大学、加州大学伯克利分校和 UIUC 等名校。


Lightspeed 合伙人 Raviraj Jain 也于 2023 年 7 月领导了该公司的种子轮融资。去年 4 月,他第一次看到 Skild AI 模型接受压力测试,至今印象深刻。


接入基础模型的机器人能在全新、未经专门设计的环境中执行任务——这可不是为了演示而特别准备的,是真实能力的展现。


看到机器人能爬楼梯时,他非常惊讶。爬楼梯是一个复杂的平衡问题,通常需要针对特定环境编程和训练,但 Skild AI 的模型能让机器人迅速学习和适应新环境,完成任务。


更让他印象深刻的是,机器人展现出一种「涌现能力」,虽然很简单(如捡起从手中滑落的东西或者旋转某个物体),但没人特意教过它们。我们曾在大型语言模型身上也观察到了类似现象。


02 数据集「规模空前」,比对手的大1000倍


模型泛化能力和涌现能力,离不开所谓「规模空前」的数据集:一个由文本、图像和视频组成的庞大数据集。


官方说法,比竞争对手使用的数据库大 1000 倍。(不知道对手是否包括特斯拉?:))



他们的基础模型在比其竞争对手大 1000 倍的数据集上进行训练,可以接入各种机器人,帮助他们获得如爬坡、识别和捡起物品等基础能力。「规模空前」归功于他们结合了多种数据收集技术,既有一些常规操作,也有两位创始人多年研究工作中开发的「独门秘方」。


他们会让人类远程操作机器人,然后收集这些操作数据。另一个办法是让机器人执行随机任务,试错学习,并记录这些丰富的数据信息。他们还利用大量公共视频训练模型。这些方法的结合有助于 AI 系统获得更强的适应性和理解力。


至于「独门秘方」,一个是 Deepak Pathak 读博时开发的一种向机器人灌输「人工好奇心」的方法。当机器人对自己行为的结果感到不确定时,它就会变得更「好奇」,愿意探索更多场景,带回更多数据,增加学习的广度和深度。Pathak 还设计了一种方法,可以将人类给 GPT 等大型语言模型下的命令(如打开一罐牛奶),转化为实际动作。


除了这些与物理世界交互和操作的真实数据,他们也结合了从模拟环境中收集的数据。虽然模拟数据不能完全替代真实数据,但它可以提供大量的补充学习材料,特别是在一些难以在现实中频繁重复的场景中。


然而,这种综合的手段也面临挑战,比如如何有效地整合来自不同源的数据。2022 年,两位创始人终于找到办法,将从不同源数据中学习(如从视频、基于好奇心、真实世界学习)整合到一个连贯系统中,大大提高了模型的学习效率和适应能力。


03 OpenAI 式颠覆


显然,Skild AI 也面临着来自一系列机器人公司的激烈竞争。


特斯拉擎天柱正在快速进化,马斯克透露年底会迎来有意思的更新。行业巨头 OpenAI 最近恢复了其机器人团队,为机器人公司提供基础模型。此外,还有由亿万富翁 CEO Brett Adcock 掌舵的人形机器人公司 Figure AI 和 OpenAI 衍生公司Covariant,该公司正在为机器人构建 ChatGPT,并已筹集了超过 2 亿美元。Skild AI 也设想了一个类似 OpenAI 的未来:


通过微调,就可以在 Skild 基础模型上构建不同的用例和产品。


这正是他们颠覆机器人行业的方式。最终,他们希望抵达机器人 AGI,人们可以在物理世界中,与之互动。


文章来源于“机器之能”,作者“关于大模型的


关键词: AI , AI机器人 , 具身智能 , Skild AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner