ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
腾讯确认“小五”出道,机器人开始整顿护工行业?
3059点击    2024-09-25 08:48


可行走,取快递,扶老人,腾讯“小五”是具身智能的雏形吗?


今日,腾讯Robotics X实验室在官方公众号发文,宣布该实验室最新研发成果人居环境机器人“5 号”(The Five,小五)正式亮相。



官方表示,“小五”作为腾讯Robotics X实验室最新一代机器人,集合了此前多代机器人研发的核心能力,融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术。


此外,该实验室还展示了“小五”在养老院的实验场景上完成执行给老人取快递、抱老人起床等多个任务。


随着“小五”的发布,是不是意味着类人型机器人的发展得到了进一步提升呢?那么我们与真正的具身智能还有多远的距离?


“小五”能干什么?


得益于前面四代机器人的积累和尝试,使“小五”拥有了多项核心能力:四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项能力。



我们看到,通过高频、低延迟的全局定位和建图(SLAM)系统,结合激光雷达和IMU等传感器,“小五”能够实时感知周围环境。这一系统不仅让“小五”在复杂环境中精准定位,还可以实时避开动静态障碍物,实现安全、有效地自主运动。



而且,运用先进的多模态人机交互技术,“小五”具备了比以往更为敏锐的感知能力,能够理解并预测人类的行动需求。


据腾讯介绍,在这些感知模块中,视觉和触觉系统扮演着至关重要的角色。视觉系统使小五能够快速定位和识别人类的状态,从而更有效地进行交互和响应。


在抱扶老人的过程中,高分辨率的触觉系统能够帮助“小五”以更安全和精确的方式提供支持和辅助,有效避免对老人造成不必要的压力或伤害。这些技术的整合不仅提高了“小五”的功能性,也增强了其在实际操作中的敏感性和人性化表现。



除了运动模态和负载能力,“小五”还可以自主折叠与展开,当不需要工作时,小五可以自主折叠起来,减少占用空间,方便运输。


除了形态创新之外,根据腰部大负载的需求,“小五”采用自研的双编码器大扭矩密度的执行器,让机器人能够更有力量,同时也在手臂上部署了自研的具有180个检测点的大曲面覆盖触觉皮肤,这使得“小五”能够拥有更加敏锐的“感官”,可以根据外界环境的变化作出相应的反应。



科技旋涡认为,从长远来看,腾讯Robotics X实验室的这一创新产品进一步提升了机器人技术的应用场景。未来,随着技术的不断进步和人们对生活质量要求的提升,智能机器人将不再仅仅是科研成果,而是我们日常生活中必不可少的成员。


具身智能到底什么时候可以实现?


谈到机器人的发展,我们不得不联想到具身智能,这个被称为大模型之后的下一代AI发展方向的技术,它到底距离我们还有多远呢?


在回答这个问题时,我们要了解,如果说机器人产业是人们普遍认知中的“未来产业”,那么人形机器人更是新技术、新材料、高端制造等多项技术的“集合体”。


比如,“身体”,机器人本体的硬件模块,包括四肢和相关功能组件;“小脑”,运动控制系统,向上承接大脑给出的任务指令,向下控制本体整机的运动;“大脑”,也就是AI大模型,负责推理、规划、决策、环境感知和交流。


斯坦福大学计算机科学教授李飞飞认为,具身智能是 AI 领域的下一个“北极星问题”之一,它能够在虚拟世界中探测和改变自身环境,与周围环境交互,学习复杂的类人任务。


即具身智能能够在与现实环境产生交互后,通过自身的学习,认识和改造世界。区别于我们目前所提到的AI大模型,如果说AI大模型现在能够认识世界,那么具身智能是AI的更高阶形式,能够对物理世界进行改造。


这也就意味着,具身智能的实现需要软硬件高度集中,其中的核心突破点在于大模型。可以说,大模型给具身智能装上了强大的“AGI大脑”。提升了机器人在感知、理解和规划任务上的泛化能力,也对人机交互产生颠覆性影响。


我们可以理解,大模型的出现让机器人理解世界的能力、推理决策的能力得到大幅度提升。


大模型之于具身智能的意义,不仅在于大模型让机器人获得自然语言能力,更重要的是这极大降低了机器人的使用门槛,有望推进机器人落地各行业应用场景。



目前来看,具身智能因其先导性、颠覆性成为世界科技强国、顶尖企业竞相布局的重要赛道。从我国来看,前有华为天才少年“稚晖君”的智元机器人一口气发布了五款商用人形机器人,后有多达 27 款人形机器人亮相世界机器人大会。



而苹果也宣布将进军机器人行业,推出一款带有机械臂的桌面机器人,代号J959。媒体猜测,苹果将利用这款机器人设备打入智能家居市场,被认为是苹果进军机器人市场的第一步。


但上述的发布也处于具身智能比较早期的发展,目前,一个最大的难点便是缺乏与物理世界的真实数据,而得不到这些数据,就无从对机器人进行训练;即使是互联网上得到的信息,在过去也很难根据这些信息进行扩展,并使机器人更好地理解世界。这也造成了在这项技术中有了不同的发展路径和落地方案。


目前来看,从具身智能公司的创始团队背景就得以窥见,从大厂机器人实验室到智驾公司,甚至连从AI顶尖院校毕业的创业者都来自不同科系,可以说,在这个仍发展初期的具身智能赛道上,各路大神在各显神通。


无法达成共识的还不仅是技术路线,对于机器人的落地场景,尤其是未来走向通用机器人的人形机器人,究竟谁能更快地实现商业化,或哪些更适合当下的具身智能机器人?目前都还没有定论。



如果说在过去非人形机器人阶段,商业化较为成熟的场景是生活服务、智能仓储和智能制造。那么对于如今的具身智能的人形机器人阶段,则既有面向B端的,也有从C端入手的。


比如在C端,针对具身智能缺乏真实数据的特点,如果能用脱敏处理从用户端获取更广泛的真实数据,从而形成数据飞轮,从这一角度来讲则可以极大地增强机器人的泛化能力。


但是,从机器人产品本身出发,不同于C端场景,B端场景并不会如此多样化。与此同时,这也意味着,在缺乏数据的当下,B端机器人的技术难度也相对较低。


相信不同企业对于具身智能的定位是不同的,但毋庸置疑的是它一定是结合各种AI技术的综合体,也将是AI未来发展的重要方向,甚至超越现阶段的大模型技术,而且它距离我们越来越近。


科技旋涡认为,而对于如今的具身智能领域而言,从目前各种各样的技术路线来看,很难确定具身智能未来的周期会如何发展。不过,有一点能确定,站在如今大模型和自动驾驶的臂膀上,具身智能的成熟期将来得更快。


写在最后


虽然具身智能的实现还需要更多时间和技术的积累,但在时代的滚滚浪潮中,我们都将成为历史的见证人,具身智能的加速发展为我们描绘了智能化发展的新图景。未来已来,将至已至,相信以具身智能为代表的新兴科技,将再一次激发人工智能的爆发点。


文章来自于微信公众号“科技旋涡”,作者“贾桂鹏”


关键词: AI , 小五 , Robotics X , 具身智能