Qwen要做机器人了:林俊旸官宣成立具身智能团队

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Qwen要做机器人了:林俊旸官宣成立具身智能团队
7170点击    2025-10-09 14:24

已经成为开源模型领头羊的 Qwen,终于要开始做机器人了。


昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。


Qwen要做机器人了:林俊旸官宣成立具身智能团队


这一举动让关注 Qwen 的开发者兴奋不已。


Qwen要做机器人了:林俊旸官宣成立具身智能团队


其实,这一切早有预兆。


前段时间,自变量机器人完成近 10 亿元 A + 轮融资,阿里云是其背后的领投方之一,这也是阿里云首次领投具身智能企业。


在之后的云栖大会上,我们也看到了阿里在具身智能方向的一系列动作。


首先,在模型方面,阿里云智能集团公共云事业部具身智能负责人高飞提到,在他走访的 30 多家具身智能公司中,绝大多数都在用 Qwen-VL 做后训练,因为 Qwen 系列模型在空间理解、路径规划、长上下文记忆方面的长板可以帮具身智能公司解决很多核心痛点。可见,Qwen 系列模型不只在 AI 领域站稳了脚跟,也正在成为具身智能领域颇受欢迎的基座模型。在这样的需求下,Qwen 没有理由不为具身智能做专门优化。


所以我们看到,在云栖大会上,新发布的 Qwen3-VL 针对细粒度视觉理解、视频时序理解、3D 感知与规划以及带图推理和视觉交互能力进行了优化,为具身智能落地提供了更强的基础模型支撑。


Qwen要做机器人了:林俊旸官宣成立具身智能团队


这次成立具身智能团队,意味着 Qwen 有意让自家模型正式走入物理世界。这不仅能检验模型在真实场景中的理解、规划与执行能力,也能反向促进模型能力的演化。在物理世界中,模型必须面对复杂的反馈、噪声与不确定性,这将迫使其在感知融合、因果推理和长程记忆等方面不断进化。更重要的是,具身化还为 Qwen 带来新的数据与应用空间,让模型从文字世界延展到机器人、自动化、交互式设备等更广阔的落地场景。


这一动作也与阿里云的整体布局相呼应。前段时间,阿里云曾表示,基于之前在 AI 大模型、智驾方面积累的能力和经验,他们已经为深度支持具身智能行业做好了准备。在此过程中,他们会与众多具身智能公司展开合作,成立具身智能团队有利于加强他们自身对行业的理解。


阿里云的具身智能布局,正值全球科技巨头纷纷加码机器人领域之际。风险投资正持续涌入人形机器人赛道,市场普遍认为,生成式 AI 与机器人技术的融合,将从根本上改变人机交互方式。阿里的入局,为这一激烈竞争的赛道增添了新的变量。


在今年 6 月的英伟达股东大会上,英伟达首席执行官黄仁勋表示,人工智能与机器人是英伟达的两大核心技术机遇,有望为公司带来「数十万亿美元」的长期增长潜力。


黄仁勋当时指出,自动驾驶将成为机器人技术的首个大规模商业化应用场景,英伟达计划通过其技术,为数十亿台机器人、数亿辆自动驾驶汽车,以及数十万座机器人工厂提供算力支撑。


本周三,软银集团宣布将以 54 亿美元现金收购 ABB 的机器人业务,这被视为其在「物理 AI」领域的一次重大战略布局。


软银董事长孙正义表示,此次收购旨在「将人工超级智能与机器人深度融合」,打造软银的「下一个前沿」。


花旗集团预计,到 2050 年,全球机器人市场规模将达到 7 万亿美元。凭借巨大的市场潜力,该领域正吸引包括政府基金在内的大量资本加速涌入。


参考链接:https://news.futunn.com/en/post/63019067/alibaba-has-taken-a-hands-on-approach-with-qwen-leading?futusource=news_newspage_recommend&level=1&data_ticket=1759975515137436



文章来自于微信公众号 “机器之心”,作者 “机器之心”

关键词: AI新闻 , Qwen , 林俊旸 , 具身智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file