可行走,取快递,扶老人,腾讯“小五”是具身智能的雏形吗?
今日,腾讯Robotics X实验室在官方公众号发文,宣布该实验室最新研发成果人居环境机器人“5 号”(The Five,小五)正式亮相。
官方表示,“小五”作为腾讯Robotics X实验室最新一代机器人,集合了此前多代机器人研发的核心能力,融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术。
此外,该实验室还展示了“小五”在养老院的实验场景上完成执行给老人取快递、抱老人起床等多个任务。
随着“小五”的发布,是不是意味着类人型机器人的发展得到了进一步提升呢?那么我们与真正的具身智能还有多远的距离?
得益于前面四代机器人的积累和尝试,使“小五”拥有了多项核心能力:四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项能力。
我们看到,通过高频、低延迟的全局定位和建图(SLAM)系统,结合激光雷达和IMU等传感器,“小五”能够实时感知周围环境。这一系统不仅让“小五”在复杂环境中精准定位,还可以实时避开动静态障碍物,实现安全、有效地自主运动。
而且,运用先进的多模态人机交互技术,“小五”具备了比以往更为敏锐的感知能力,能够理解并预测人类的行动需求。
据腾讯介绍,在这些感知模块中,视觉和触觉系统扮演着至关重要的角色。视觉系统使小五能够快速定位和识别人类的状态,从而更有效地进行交互和响应。
在抱扶老人的过程中,高分辨率的触觉系统能够帮助“小五”以更安全和精确的方式提供支持和辅助,有效避免对老人造成不必要的压力或伤害。这些技术的整合不仅提高了“小五”的功能性,也增强了其在实际操作中的敏感性和人性化表现。
除了运动模态和负载能力,“小五”还可以自主折叠与展开,当不需要工作时,小五可以自主折叠起来,减少占用空间,方便运输。
除了形态创新之外,根据腰部大负载的需求,“小五”采用自研的双编码器大扭矩密度的执行器,让机器人能够更有力量,同时也在手臂上部署了自研的具有180个检测点的大曲面覆盖触觉皮肤,这使得“小五”能够拥有更加敏锐的“感官”,可以根据外界环境的变化作出相应的反应。
科技旋涡认为,从长远来看,腾讯Robotics X实验室的这一创新产品进一步提升了机器人技术的应用场景。未来,随着技术的不断进步和人们对生活质量要求的提升,智能机器人将不再仅仅是科研成果,而是我们日常生活中必不可少的成员。
谈到机器人的发展,我们不得不联想到具身智能,这个被称为大模型之后的下一代AI发展方向的技术,它到底距离我们还有多远呢?
在回答这个问题时,我们要了解,如果说机器人产业是人们普遍认知中的“未来产业”,那么人形机器人更是新技术、新材料、高端制造等多项技术的“集合体”。
比如,“身体”,机器人本体的硬件模块,包括四肢和相关功能组件;“小脑”,运动控制系统,向上承接大脑给出的任务指令,向下控制本体整机的运动;“大脑”,也就是AI大模型,负责推理、规划、决策、环境感知和交流。
斯坦福大学计算机科学教授李飞飞认为,具身智能是 AI 领域的下一个“北极星问题”之一,它能够在虚拟世界中探测和改变自身环境,与周围环境交互,学习复杂的类人任务。
即具身智能能够在与现实环境产生交互后,通过自身的学习,认识和改造世界。区别于我们目前所提到的AI大模型,如果说AI大模型现在能够认识世界,那么具身智能是AI的更高阶形式,能够对物理世界进行改造。
这也就意味着,具身智能的实现需要软硬件高度集中,其中的核心突破点在于大模型。可以说,大模型给具身智能装上了强大的“AGI大脑”。提升了机器人在感知、理解和规划任务上的泛化能力,也对人机交互产生颠覆性影响。
我们可以理解,大模型的出现让机器人理解世界的能力、推理决策的能力得到大幅度提升。
大模型之于具身智能的意义,不仅在于大模型让机器人获得自然语言能力,更重要的是这极大降低了机器人的使用门槛,有望推进机器人落地各行业应用场景。
目前来看,具身智能因其先导性、颠覆性成为世界科技强国、顶尖企业竞相布局的重要赛道。从我国来看,前有华为天才少年“稚晖君”的智元机器人一口气发布了五款商用人形机器人,后有多达 27 款人形机器人亮相世界机器人大会。
而苹果也宣布将进军机器人行业,推出一款带有机械臂的桌面机器人,代号J959。媒体猜测,苹果将利用这款机器人设备打入智能家居市场,被认为是苹果进军机器人市场的第一步。
但上述的发布也处于具身智能比较早期的发展,目前,一个最大的难点便是缺乏与物理世界的真实数据,而得不到这些数据,就无从对机器人进行训练;即使是互联网上得到的信息,在过去也很难根据这些信息进行扩展,并使机器人更好地理解世界。这也造成了在这项技术中有了不同的发展路径和落地方案。
目前来看,从具身智能公司的创始团队背景就得以窥见,从大厂机器人实验室到智驾公司,甚至连从AI顶尖院校毕业的创业者都来自不同科系,可以说,在这个仍发展初期的具身智能赛道上,各路大神在各显神通。
无法达成共识的还不仅是技术路线,对于机器人的落地场景,尤其是未来走向通用机器人的人形机器人,究竟谁能更快地实现商业化,或哪些更适合当下的具身智能机器人?目前都还没有定论。
如果说在过去非人形机器人阶段,商业化较为成熟的场景是生活服务、智能仓储和智能制造。那么对于如今的具身智能的人形机器人阶段,则既有面向B端的,也有从C端入手的。
比如在C端,针对具身智能缺乏真实数据的特点,如果能用脱敏处理从用户端获取更广泛的真实数据,从而形成数据飞轮,从这一角度来讲则可以极大地增强机器人的泛化能力。
但是,从机器人产品本身出发,不同于C端场景,B端场景并不会如此多样化。与此同时,这也意味着,在缺乏数据的当下,B端机器人的技术难度也相对较低。
相信不同企业对于具身智能的定位是不同的,但毋庸置疑的是它一定是结合各种AI技术的综合体,也将是AI未来发展的重要方向,甚至超越现阶段的大模型技术,而且它距离我们越来越近。
科技旋涡认为,而对于如今的具身智能领域而言,从目前各种各样的技术路线来看,很难确定具身智能未来的周期会如何发展。不过,有一点能确定,站在如今大模型和自动驾驶的臂膀上,具身智能的成熟期将来得更快。
虽然具身智能的实现还需要更多时间和技术的积累,但在时代的滚滚浪潮中,我们都将成为历史的见证人,具身智能的加速发展为我们描绘了智能化发展的新图景。未来已来,将至已至,相信以具身智能为代表的新兴科技,将再一次激发人工智能的爆发点。
文章来自于微信公众号“科技旋涡”,作者“贾桂鹏”