机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步
8113点击    2024-08-12 13:46

别光只看Figure 02了,国产机器人最新成果曝光,大秀肌肉!


就在北京亦庄,竟有这么一家人形机器人“健身房”。


这里的机器人率先实现在跑步机上训练,一小时能跑6km的那种:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


而这只是热身,跑完还要爬楼梯:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


到了室外,机器人专用道也安排上了,30度高温下不能停:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


时不时还要来点草坪、斜坡等复杂地形上难度:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


它就是今年四月份在国内首发的纯电驱全尺寸人形机器人天工,由北京具身智能机器人创新中心研发。


刚问世那会儿,天工主打的还是拟人奔跑,短短几个月,本事又长了不少。


除了上面所展示的在跑步机上奔跑、户外复杂地形行走,天工现在还加持了大模型,可中英文对话,还能听从人类指令抓取物品。


最近,2024世界机器人大会就要举办了,量子位提前打听到,整合“不只”这些能力,进化版“天工”将在大会上亮相。


而且到时候天工会换“马甲”,装上手,还会升级大关节


关于进化版天工的能力,我们和其运动控制负责人郭宜劼聊了聊。


全身42个自由度,大模型加持


升级后的天工功能参数一览如下:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


和之前相比如下表,身高163cm,体重由原来的43kg增加到了56kg。


全身自由度增加到了42个,相比之前单只手臂自由度由3个增加到7个,颈部也增加了3个自由度。


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


此前天工“没有手”,这次也装上了。单只手重达600g,具有6个自由度,触觉传感器精度在0.3N以内,单指的抓握力大于1kg。


而且天工还配备了四个全场景双目结构光3D相机、高精度六维力传感器,可实现360度环境感知。


通过对环境的感知,天工能适应复杂地形,在草地、沙地、丘陵、碎石里移动,应对30cm的地形差也不是问题。


奔跑起来稳定性也提升了,速度可达6km/h。


除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


现在能开口说话和人类交互,支持中英文。


还能听从人类指令抓取物品:


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


而这些只是其中的一部分,世界机器人大会上还会有更多展示和惊喜。


天工首秀那会儿,主打拟人奔跑单项能力。从目前的进化版来看,结合了感知交互,可以说,天工已经初步形成了具身智能体形态。


研究具身智能规划决策和任务执行,也正是天工背后团队目前的关注重点。


打造具身智能体


以具身智能为基础,目前在技术实现上,研究团队重点提升了天工的视觉感知能力


之前天工行走是“盲视”状态,需要用脚掌对地面进行试探,而现在基于视觉感知,面对较大地形差,天工可以通过提前预测做出抬高腿等动作来应对。


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


具体方法上,团队基于强化学习,自研了运动技能学习方法——基于状态记忆的预测型强化模仿学习


此前量子位也有介绍,该方法融合了传统方法平稳性高的优点,以及强化学习泛化性强、不依赖环境的优点。


既解决了强化学习带来的定位精度差的问题,又解决了模型预测控制方法当中对于非结构化环境适应性差的问题。


天工运动控制负责人郭宜劼也向量子位透露,之前团队在训练时发现,一些网络在实际运行过程中可能会很容易受传感器漂移的干扰,有时会表现出姿态的不稳定等情况,由此提出了这种方法。


初代天工发布后,团队在接下来的几个月的训练中,为天工加入了更多的历史状态记忆,使其能够对当前的自身状态和环境地形进行估计,从而有更好的泛化效果。


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


郭宜劼还表示,目前具身智能要解决的是“Action”任务规划执行这方面的问题。


无论从任务种类还是复杂度上来说,让它能够覆盖人类日常工作生活中大部分的任务。它能干的活种类变多,大脑再去配合起来就能够实现更复杂、更长线的任务。


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


对于实现复杂任务规划,他分享了几条技术路线:


像是特斯拉机器人,主要采用的是收集数据,然后用数据进行监督学习,针对比较单一固定的场景训练机器人自动执行。这种方法虽收效比较快,但泛化能力差一些。


还有一种是在仿真环境中进行强化学习训练,主要依赖的是在一个环境中进行不断地试错,自我学习。这种方法遇到的主要问题是,怎样从仿真环境迁移到真实的物理场景中。从感知层面到和具体的物理交互,仿真和真实场景都有很大的差别。


另外一种方法是直接用大模型输出一些任务点,然后用传统的运动规划去执行这些任务。


而天工研发团队的方案是将不同的方法融合,下一步要打造出一个元技能库


现在这个阶段我觉得是要扩大机器人的技能库……包括这几种方法在内,每一种方法都可以用来解决不同的任务场景。所以说技能库里每种技能可能是使用不同的方式来实现的。

解决国内机器人“共性”问题


再来说说天工背后公司,量子位此前也有介绍过。


北京具身智能机器人创新中心(下称创新中心),原名北京人形机器人创新中心,去年11月成立,由小米机器人、优必选、京城机电、亦庄机器人等联合组建。


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


他们瞄准的是解决具身智能机器人的关键共性问题,避免国内机器人行业重复简单造轮子的过程。


创新中心聚集了一批顶尖科学家和工程师,还牵头成立了创新中心专家委员会和北京人形机器人产业联盟。


创新中心专家委员会由中国科学院院士乔红担任主任,通用研究院院长朱松纯、智源研究院理事长黄铁军、信通院总工程师魏然担任副主任。


今年四月份,创新中心推出了“天工”通用机器人母平台,即具身智能硬件开源平台。


“天工”平台可实现灵活扩展软、硬件等功能模块,提供了一系列开放接口,科研机构及机器人相关企业可基于“天工”母平台软硬件功能进行二次开发。


当时他们就预告了将着眼于依靠大模型驱动,探索通用具身智能平台。而现在多能具身智能体母平台“开物”,也逐渐浮出水面,正紧锣密鼓研发中。


“开物”平台着眼于具身智能大模型及框架,聚焦多模态的关键法、具身智能仿真应用建设及工具链整套体系建设。


围绕“开物”,团队正在打造大规模具身智能数据集,用来支撑超70亿参数视觉语言多模态大模型训练调优,实现机器人中文互动、开放问答、场景视觉理解、具身操作等能力。


计划是,在2025年底前发布200万条高质量数据


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


话说回来,最近人形机器人领域有不少新进展传出。


优必选透露人形机器人已在极氪工厂打工;特斯拉官图显示Optimus已进厂挑拣电池;OpenAI加持的机器人Figure 02,进驻宝马打工……


虽然“天工”和它们不是一个赛道,主要是解决具身智能的共性问题,但……也没能逃过搬砖的命运。


据了解,它正初步在一些场景中进行数据采集试训,比如重复性比较高、枯燥乏味的搬运分拣物品,在危险场景如矿井、工地进行巡检、搜救……


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


2024世界机器人大会马上将于8月21日在北京经济技术开发区开幕,期待进化版“天工”的家人们可以码住了,听说创新中心会有一个精彩的展位,可以看到“天工”机器人家族的集体亮相,还会办一个分论坛~


One More Thing


为啥要让机器人在跑步机上跑?大伙儿猜猜看(doge)


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步


答:除了对平衡性要求更高外,跑步机速度可控,能够比较准确客观测试;机器人跑步实验需要占用比较大的场地,跑步机省地方啊。


文章来源于“量子位”,作者“西风 一水


机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”跑两步







AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI