美国时间上周五早上,Physical Intelligence的官方账号发布了一条关于人形机器人视频的动态,视频中出现了令人熟悉的中国公司影像,随后星尘智能视频号也发出了同一条视频。星尘智能与Physical Intelligence似乎已经开展了合作。
要知道,Physical Intelligence拥有着机器人领域的全明星团队,是行业迅速崛起的领头羊。
联合创始人Sergey Levine现任UC Berkley电气工程与计算机科学系副教授,曾带领团队与谷歌联合开发RT系列机器人项目。另一位联合创始人Chelsea Finn是Stanford计算机科学与电气工程系助理教授,多任务元学习的先驱,曾指导学生开发了ALOHA项目。两位创始人均是通过交互学习推动智能体通用算法研究的领军人物。
公司高管同时在推特上转发了视频。Sergey Levine评论说:“真的很惊讶这项任务完成得如此迅速,期待未来更多合作。”看来,星尘智能与Physical Intelligence还会有更多惊喜。
目前,人形机器人技术方向正朝着多模态感知、自主决策和精细动作执行等方向发展,以实现机器与环境的有效交互和自主学习演进。Physical Intelligence和星尘智能宣告牵手,在数据和模型层展开合作,强强联合将推进通用人工智能进入物理世界,共筑世界模型。
Physical Intelligence可以说是当前机器人行业的当红炸子鸡。
而Physical Intelligence的技术之所以重要,是因为它致力于开发能够控制任何机器人执行任何任务的基础模型。公司的π0模型通过整合图像、文本和动作数据进行训练,使机器人能够跨多种任务和环境进行操作,从而实现从物体分类到动态操控的多种能力。
Physical Intelligence在资本市场上更是火爆,最近以24亿美元估值完成了一轮4亿美元的融资,吸引了包括亚马逊创始人杰夫·贝索斯、OpenAI在内的多家重量级投资者,其他投资者还包括Thrive Capital和红杉资本等机构。
星尘智能则是在今年迅速出圈,曾被Figure AI CEO转发评论的一家机器人公司。4月S1第一次发布时就因“最强操作性能”引起广泛关注。
在8月举办的世界机器人大会上,星尘智能的AI机器人助理「Astribot S1」凭借其出色的全能操作和具身人形设计,成功执行了弹扬琴、熨叠衣物、物品分拣、颠锅炒菜、吸尘清洁、竞技叠杯等一系列复杂且具有挑战性的任务,迅速吸引了行业的广泛关注。
星尘智能的Astribot S1机器人不仅展示了先进的多模态感知和认知处理能力,还体现了在AI驱动的实时决策和智能交互方面的前沿创新。同时,星尘智能在数据采集和AI训练方面取得的进展,推动了模型训练的高效发展。这些进展不仅能为自身的AI系统提供支持,也为Physical Intelligence的AI模型迭代进化提供了坚实的技术基础和协作平台。
不仅如此,Physical Intelligence致力于将人工智能技术融入物理世界的应用中,而星尘智能构建了以AI为核心的创新系统(Design for AI),设计出能够最大化发挥AI能力的机器人架构。两家公司有着共同的目标,将通用人工智能引入物理世界,可以说是“天作之合”。
在视频中,我们看到S1机器人展现了其在处理复杂任务时的高度灵活性和精确性。机器人能够轻松地拿起咖啡胶囊,顺利打开咖啡机的胶囊仓,并精准按下按钮开始冲泡咖啡。整个过程流畅自如,显示出机器人卓越的实时感知与智能规划能力,操作与人类几乎无异。
本次机器人的泛化能力令人印象深刻。它不仅能够完成特定的任务,还能灵活应对不同环境和任务的变化。例如当工作人员随意放置杯子,S1都能实时识别和抓取。再比如,当工作人员取走红色咖啡胶囊时,机器人也能迅速调整策略,重新找到咖啡胶囊并继续任务。
在人工智能的发展中,算法、算力和数据是核心要素。尽管算力和算法不断进步,数据却是一个相对恒定的因素。对于机器人而言,理解物理世界中的多维度信息,如位置和力,是至关重要的。然而,尽管我们处于GPT时代,对于训练机器人来说,直接可用的物理世界高质量数据仍然非常有限。
星尘智能机器人能有出彩的表现,原因或许也有数据上的优势。根据公开信息,星尘智能S1的模型通过低成本、高效率地利用现有的真实世界视频数据和人体动作捕捉数据,能够从第一人称视角收集触觉、力觉、视觉、听觉等多维度的高质量数据。它为AI的学习和执行提供了更丰富、更高维度的数据支持。
星尘智能创始人来杰曾在报道中提到,他在百度时已意识到数据量级、数据维度的重要性。在星尘,他将对力的长期思考和 AI 结合,打造了突破性的具身智能数据获取方案。
Physical Intelligence看重星尘智能,另一个原因应该是星尘智能机器人强大的产品性能,S1的软硬一体化架构设计使其既能控制硬的准度,又能把握软的力度。其官网显示,S1的末端最高速度达到了10m/s,单臂额定负载达到了10公斤,拥有类似人类关节的设计,重复定位误差只有30微米,一系列指标均超越了普通成年男性。无论是科研还是产业上,操作能力正在逐渐成为具身智能的焦点。
在今年11月初举行的“智源论坛·2024具身与世界模型专题峰会”上,星尘智能创始人兼CEO来杰表示,构建世界模型是星尘智能的目标之一。“我们的机器人正是在世界与世界模型之间收集数据、理解数据,再与物理世界交互,把结果反馈给世界模型。”
世界模型被认为是通往AGI的一大关键路径,也为具身智能的通用化提供了重要基础,两家的合作或将加速未来范式的到来,推动机器人世界模型优化,推动机器人从单一的工业应用向更多的日常生活场景扩展。
合作还可能促使两家公司在模型优化、行业标准、数据共享和开发工具等方面的联合探索,推动整个行业生态系统的完善,建立更加开放和互联的技术架构,使得其他企业也能加入到这一技术进步的浪潮中。
ZP将持续关注两家公司在未来发布的更多技术成果,期待它们共同为机器人技术的发展和应用带来新的突破,促进更加智能化和人性化的机器人世界的到来。
文章来自于“Z Potentials”,作者“Z Potentials”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md