英伟达老黄怎么看 Agentic AI & Physical AI?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
英伟达老黄怎么看 Agentic AI & Physical AI?
2792点击    2025-01-14 09:23

英伟达CEO黄仁勋最近在CES 上的主题演讲及问答,分享了他对未来的愿景。这显然是Agentic AI和Robotics的结合,他称之为Physical AI。这次重点谈谈黄仁勋对Agentic AI的看法、向physical intelligence发展的过程,以及在这一转变过程中应该牢记的可行见解。黄仁勋预测,10年内,机器人可能会达到连怀疑论者都感到惊讶的能力水平。


英伟达CEO黄仁勋极具魅力和远见,在他的主题演讲中,一直站在定义AI的最前沿。在最近的CES 演讲中,黄阐明了AI发展的变革愿景--在这个世界里,digital agents可以无缝执行复杂的任务,而physical AI系统可以从根本上重塑我们与现实世界的互动。


这就是他为AI的发展绘制的路线图:


英伟达老黄怎么看 Agentic AI & Physical AI?


Perception AI:现代机器学习的基础,通过训练系统来解释和分析数据


Generative AI: 时下的重点--创建文本、图像和其他内容的模型,正在改变游戏、营销和媒体等行业


Agentic AI: 能够管理工作流程、解决问题和提供见解的autonomous agents的兴起


Physical AI:下一步--AI系统获得在物理世界中运行和互动的能力


黄认为,人类机器人技术是一个价值数百亿美元的产业,但如果没有有效的agentic systems,这是不可能实现的。


The Age of Agentic AI


许多人在预测中宣称2025 年是" The Year of Agents "。黄仁勋对此也非常着迷,将这些系统描述为 "新的数字劳动力",能够对任务进行推理,将其分解为可执行的子任务,检索相关数据,并使用工具生成高质量的结果。与传统软件系统不同,agentic AI能适应动态环境,并能自主或半自主地运行,从而增强各行各业人类的能力。


What Makes Agentic AI Unique?


Reasoning and Adaptability: 这些系统可以分解复杂的问题,分析环境因素,并动态地确定任务的优先次序


Multimodal Capabilities:  利用基础模型,整合语言、视觉和音频,处理来自多种来源和格式的信息


Tool and Data Integration: Agentic AI不仅能处理静态输入,还能与工具互动,从数据库或网络中检索信息,并综合各种见解


What are Real-World Applications according to Huang?


在黄仁勋的设想中,Agentic AI 无处不在,横跨各个行业和使用案例。这方面的例子包括


Knowledge Workers: AI研究助理可简化对学术期刊或财务报告等复杂文档的分析,将其转化为摘要或播客等易于获取的格式


Industrial Optimization: Agents监控制造或物流流程,识别效率低下的环节并提出改进建议


Software Security: AI agents持续扫描代码库中的漏洞,向开发人员提供实时反馈


Healthcare and Drug Discovery: 虚拟实验室agents可筛选数十亿种化合物,以比以往更快的速度和更高的成本效益确定有前途的候选药物


这些例子凸显了AI如何简化和改进通常依赖人力的任务。


The next frontier of AI is Physical AI


Agentic AI侧重于数字任务,而下一个前沿领域则是physical AI。黄仁勋将physical AI描述为能够理解现实世界并与之互动的系统。这一转变涉及开发能够理解物理动态、空间关系和环境细微差别的AI模型,使其能够在非结构化的真实世界环境中运行。


What is Physical AI?


Physical AI建立在agentic systems的基础之上,但也包含了对物理世界的理解,需要模型才能掌握:


Geometry and Spatial Reasoning: 了解三维空间以及物体如何在其中相互作用


Physical Dynamics: 重力、摩擦力和惯性等概念支配着现实世界中的运动和行为


Temporal Awareness:预测和适应时间变化的能力,如天气条件或物体轨迹的变化


Is Physical AI a new concept?


是,也不是。机器人产业是一个成熟的产业,围绕它开展了大量引人入胜的研究,就连OpenAI 也曾有过一个机器人研究部门。早在2019 年,它的Rubik’s Cube-solving robotic hand就占据了头条新闻,展示了强化学习如何教会机器处理复杂的物理任务。这感觉就像是变革的开始--AI与机器人技术的无缝融合。


但在 2021 年,OpenAI悄然退出了机器人领域。这一决定不是因为失败,而是因为战略转移。机器人技术需要硬件集成、资源繁重的基础设施,以及解决模拟环境与真实世界之间顽固差距的方案。对OpenAI而言,回报不足以证明付出的努力是值得的。他们决定在GPT等大模型上加倍努力--2021 年,GPT-3 已经显示出巨大的潜力,可以产生更广泛的影响。多亏了这个决定,现在才有了ChatGPT 和汹涌澎湃的生成式AI,它将agentic systems提升到了一个全新的高度。


通过实现Agentic AI的这一飞跃,OpenAI 搭建了一个舞台,让其他人能够重新想象可能的事物。黄仁勋受到这一转变的启发,设想了由先进的AI= Physical AI,来实现机器人技术的未来。通过逆向思维,他看到了英伟达如何能够在实现这一未来的过程中发挥关键作用,构建实现这一目标的工具和基础设施。


Working backwards approach


黄仁勋的"逆向思维"方法首先将AI的未来设想为各行各业的基础层,让AI agents和物理系统自主、智能地行动。根据这一愿景,他确定了Nvidia 为实现这一未来而必须开发的必要元素--可扩展架构、强大的训练系统和工具。黄仁勋逆向思维,概述了三大关键计算机--对现代人工智能和机器人系统至关重要的基本计算架构:


Training Computers 旨在处理训练AI模型所需的海量数据和计算能力。这些计算机对于生成准确可靠的AI模型至关重要


Simulation and Digital Twin Computers 能够创建数字孪生和模拟,提供虚拟环境,在实际部署前测试和优化AI和机器人系统


Deployment Computers 负责在实际应用中部署训练有素的模型。例如,汽车或机器人系统中的AI计算机可提供自主操作所需的计算能力


Why Robotics become so important now? Huang thinks they might become the largest computer industry ever


全球劳动力人口正在减少,在一些制造业大国,这种减少尤为明显。对于这些国家来说,确保机器人技术成为其工业中富有成效的组成部分,已成为当务之急的战略问题。在劳动力增长不可预见的情况下,开发和部署先进机器人系统的紧迫性空前高涨。


Jensen Huang:


所有移动的东西都将是自主的。这已成定局。机器人没有任何限制。这很可能是有史以来最大的计算机产业 原因是我们不需要比人更多的手机但是,但你知道,机器人,你想造多少就造多少。


Opportunities


Industry-Specific AI Agents: 从医疗到物流,专业代理可彻底改变工作流程和生产率


Robotics and Automation: Physical AI有可能改变制造业、仓储业和自主运输业等行业


General-Purpose Robots:随着合成数据和模仿学习技术的进步,在非结构化环境中运行的多功能仿人机器人的梦想比以往任何时候都更加接近


NVIDIAs Strategy: Building an Industry, Not Just Products


正如黄仁勋所阐述的那样,英伟达战略的一个决定性方面就是致力于塑造和推动整个行业,而不仅仅是创造单个产品。英伟达就像一辆内置 3D打印机的坦克:勇往直前,不断在计算和AI领域构建新的现实。每一次进步,NVIDIA都会重塑格局,打造出其他公司赖以创新的框架。其庞大的资源推动着硬件、软件和生态系统的同步发展,使各行各业都能围绕其轨道不断发展壮大。英伟达战略的核心是建立一个生态系统,为开发人员、研究人员和企业提供在英伟达基础上进行开发的工具,使英伟达成为创新的不二之选。他们也许会制造自己的机器人,也许不会,但英伟达将自己定位为在各行各业推广Physical AI的催化剂。


英伟达老黄怎么看 Agentic AI & Physical AI?


How will the economics work?


正如黄仁勋所描述的那样,人类机器人技术的经济性主要体现在易于部署、可扩展性和利用规模经济等方面:


Brownfield Deployment Advantage:人类机器人技术的突出之处在于它可以部署在现有环境中(Brownfield),而无需对基础设施进行重大改动。与通常需要定制设施(Greenfield deployment)的带轮子或履带的机器人不同,人形机器人技术可以无缝集成到当前操作中。这与智能手机的应用类似,智能手机不需要新的基础设施,因为它们适合用户现有的生活方式(如pockets)。


Ease of Deployment and Scalability:人形机器人的部署非常简单,可以快速扩展。一旦将引入设施或操作中,就可以在各种情况下快速复制。这种可扩展性提高了采用率,并随着数量的增加而降低了单位成本


Economies of Scale and the Technology Flywheel: 随着人形机器人部署规模的扩大,规模经济开始发挥作用。大规模生产和部署所实现的成本效益推动了技术飞轮,加速了创新。这种循环--采用推动成本降低,进而导致进一步采用--确保了技术的不断改进和应用范围的不断扩大


Enabling Industries with Tailored Solutions: Nvidia 专注于为各行各业赋能,而不是直接参与竞争。通过提供AI企业解决方案、agentic AI toolkits和模块化硬件/软件平台等工具,他们使汽车、机器人等不同行业能够将AI整合到其运营中。这种适应性使丰田、Waymo和特斯拉等公司能够根据自己的具体需求量身定制Nvidia 的堆栈,从而增强自身的竞争优势


Accelerated Innovation:易于部署、规模化和飞轮效应的结合意味着人类机器人技术将得到快速发展


Nvidia 预测,10 年内,这些机器人的能力将达到连怀疑论者都感到惊讶的水平。


The Long Game


英伟达在Blackwell GPU和AI模拟平台等基础技术领域的投资,旨在为未来数十年的各行各业提供支持。这种长远眼光确保了英伟达在AI应用呈指数级增长的过程中始终不可或缺。通过将其战略与更广泛的技术趋势相结合,英伟达确保自己不仅是AI革命的一部分,而且是定义其方向的领导者。


并且,你猜怎么着?2025 年 1 月,OpenAI 宣布重返机器人领域。Caitlin Kalinowski分享了招聘硬件工程师和机器人专家的信息,这些工程师和专家应在自动驾驶汽车、无人机、轮式机器人、人形机器人和软体机器人等领域拥有丰富经验。该团队的目标是应对曾经导致OpenAI 退出机器人技术的挑战,现在则利用多年的AI进步和更深入的行业洞察力。这一转变凸显了具身智能日益增长的潜力。


Conclusion


那么,我们将何去何从?今年,AI agents将从软件工程、数字营销和客户服务领域开始起飞。但黄仁勋设想,在未来,agentic和physical AI将融合在一起,重新定义从制造业到医疗等各个行业。对于许多人口减少的国家来说,依靠机器人来维持生产力和经济增长已成为当务之急。从自动驾驶汽车到工业机器人,AI正迅速成为未来产业的支柱。这些数以百万计的新型机器人和自动驾驶汽车将推动数百亿美元的资金投入支持数据中心。AI不再仅仅是一种工具;我们正朝着使用工具的agents和助手方向发展--这是在计算堆栈之上的一个全新层。每家工厂都将拥有一个数字孪生系统,在实际部署前通过镜像操作来优化关键绩效指标。黄仁勋的警告很明确:如果你的企业还没有利用AI助手,那么你已经落后了。OpenAI 重新关注机器人技术只会加强这种转变。他们的回归表明,具身智能正在成为整个领域的优先事项,标志着AI的发展向前迈出了关键一步。


文章来自于“X Partners”,作者“浅浅是Cloris”。


英伟达老黄怎么看 Agentic AI & Physical AI?

关键词: AI , Physical AI , Agentic AI , 黄仁勋
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md