图片来源:a16z
Jensen Huang是全球AI算力龙头NVIDIA的创始人兼CEO,Arthur Mensch是生成式AI独角兽公司Mistral的联合创始人兼CEO,两位AI领域的专家共同讨论主权AI,国家AI战略、开源协作等话题,本文为此次访谈实录。
Host: 今天我们要讨论的是主权AI、国家基础设施以及开源的话题。让我们先从各国领导人最常问的问题开始,AI是否真的是一种通用技术?在人类历史上,我们可能只经历过少数几种被经济学家称为“通用技术”的领域,这些技术能广泛加速整个社会的经济进步,例如电力和印刷术。现在所有人都在问的问题是,AI是否应该以同样的方式看待?或者说,为什么AI不能仅仅是另一种重要但本质上局限的技术?
Arthur Mensch: AI是一种通用技术,因为它从根本上彻底改变了我们构建软件和使用机器的方式。就像互联网是一种通用连接技术一样,AI在此处是一种通用技术。它允许构建代表你行事的Agents,从这一点来看,它可以应用于任何垂直行业。它可以用于服务业、公共服务,可以改变公民的生活,可以用于农业,当然也可以用于国防用途。因此,它涵盖了国家需要关注的所有领域。正因如此,任何国家都应将其视为优先事项,并制定专门的国家AI战略。
Jensen Huang: Arthur说的所有内容100%正确。但问题恰恰出在这里,如果AI是通用技术,而某一家公司可以打造出终极通用技术,那为什么其他人还需要做这件事呢?这正是其逻辑漏洞所在。但这种观点也是一种心理陷阱,试图让人们相信智能这种技术是少数人才能构建的产物,其他人只需坐等其成。我的建议是,每个国家都应积极投入AI建设。这不是属于全球少数科技公司的特权,更是全人类的共同事业。没有人会比瑞典更关心瑞典文化、瑞典语、瑞典人民和瑞典生态系统,没有人会比沙特阿拉伯更关注沙特生态,同样,以色列的国家利益也唯有以色列人最重视,尽管AI本身是通用技术。我完全同意“智能怎么可能不具备通用性”的观点,但它同样需要高度专业化。坦率地说,我并不期待一个通用的聊天机器人能在某一特定疾病领域成为专家。我仍然更倾向于让那些在该领域高度专业化的人来进行微调、训练以及后期训练。一个AI模型应该在该领域实现专业化。
Arthur Mensch: AI作为一种通用技术,其性质类似于编程语言,它具备普适性,但同时也承载着文化属性。这意味着,虽然存在一些基础性的基础设施(如芯片,并非每个国家都会自建)和通用模型(如基于网络数据压缩训练的基础模型),这些最终可能开源,为构建专用系统提供基础。除此之外,机构、企业和国家需要根据自己的需求进行定制化开发。有效的方式是采用一个通用模型,例如开源模型,将特定领域的知识提炼到系统中,如公民或员工的专业经验,融入代表你行事的Agents。通过这种渐进过程,这些Agents会越来越精准地遵循国家或企业在构建AI系统时设定的指令和规范。你需要垂直领域的专家、文化专家或具有特定国家议程的人员,与能够提供易用、易定制化开源基础设施的科技公司合作。关键在于,AI是一种横向技术,要使其真正发挥作用,需要横向技术提供商与垂直领域专家的深度协作。
Host: 但与历史上之前的通用技术浪潮(如电力或印刷机)不同,这次有何不同?如果我是一个国家的领导人,试图理解在我的国家中关于AI的正确思考框架是什么,我应该将其视为数字劳动力吗?还是应该再次将其视为桥梁?
Arthur Mensch: AI与电力类似,它将在未来几年对每个国家的GDP产生双位数的影响。从经济角度来看,每个国家都需要重视这一点,因为如果它们未能建立基础设施、未能在本土打造主权AI能力,就意味着这些经济利益可能会流向其他国家。这正在改变全球的经济平衡。从这个意义上说,这与电力并没有太大不同。100年前,如果你不建造发电厂,就意味着你准备从邻国购买电力,这最终会导致依赖性,而这并不是好事。从这个角度来看,AI与电力是相似的。
但有什么不同之处?我认为有两点。首先,它是一种可塑性技术。如果你想用它创建数字劳动力,你需要塑造它。其次,你需要拥有基础设施、人才和软件,而这些人才需要在本土培养,我认为这一点非常重要。原因在于,与电力不同,这是一种内容生成技术。你拥有能够生成内容(如文本、图像、语音)并与人类互动的Agents。当生成内容并与社会互动时,你就成为了社会建构的一部分。从这一点来看,社会建构承载着企业或国家的文化和价值观。如果你希望这些价值观不会消失且不依赖中心化提供商,就需要比参与电力建设更深入地参与其中。
Host: Jensen,你同意这一点吗?
Jensen Huang: 可以从几个角度来思考这个问题。你的国家数字智能不太可能是你未经考虑就外包给第三方的存在。数字智能如今是你的一项新基础设施,如同电信、医疗、教育、高速公路和电力,现在又新增一层,这新的一层就是你的数字智能。你有责任决定希望它如何发展,是选择完全外包从而永远不必操心智能问题,还是将其视为需要深度参与甚至掌控的国家基础设施,当然,这涉及Arthur提到的AI工厂、基础设施等要素。另一种视角是将其视为你的数字劳动力。这同样是一个新维度,你需要决定国家或企业的数字劳动力是否外包并寄望其按预期发展,还是主动参与塑造、培育和优化。就像我们始终在雇佣通用型员工,他们来自校园,有些更具通用性,有些更聪慧。但一旦成为员工,我们会对其进行入职培训、技能培养、设定防护措施、持续评估与提升。我们投入必要资源,将通用智能转化为可获益的超智能。
我认为第二层思考应将其视为数字工作流。当然,基础设施与劳动力这两种视角都对国家经济、社会进步和文化传承有贡献。在这两种情况下,国家都需要发挥非常积极的作用。回到你最初关于主权AI的问题,如何思考它?它绝对是通用技术,但你必须决定如何塑造它。你国家的数字数据属于你,就像国家图书馆的藏书和历史档案,只要你想数字化它,你可以向全球开放,也可以仅对本国的公司、研究机构和公民开放。这些数据本质上属于你,因为它们是文化根基的载体。它们属于你,因为你决定如何利用它们造福人民。它们属于你,因为你有责任塑造它们的未来,这就是主权AI的要义,这是你的责任。
Host: 国家还资助和保护其他几种类型的资产。比如军队、电力网络等。如果说我已经理解了AI基础设施和主权AI的重要性,那么我现在是否需要掌控整个技术栈的每一个环节?
Arthur Mensch: Jensen提到了数字劳动力,我认为这是一个很好的类比。你需要一个针对AI员工的入职平台,这意味着你需要能够定制模型,将国家图书馆中沉淀的知识注入模型,使其能更好地使用你们的语言。你需要让系统理解本国的法律法规,从而确保部署AI软件时设置的防护栏,能与你过往制定的所有规范保持合规。我们正在构建的平台正是这种支持定制、评估,并在发现问题时进行修复、调试的入职平台。更重要的是,当定制系统完成后,必须能自主维护它们。这意味着要能在自有基础设施上部署,甚至能让技术合作伙伴逐步退出系统闭环。
Jensen Huang: IT部门将变成你数字员工的人力资源部门。他们将使用Arthur提到的工具来为AI员工办理入职、对AI系统进行微调、设置护栏、评估系统表现,并持续优化改进。这种自我强化的飞轮效应将由现代化升级后的IT部门来管理。未来人类员工将与数字员工协同工作,这种组合非常具有想象力。但关键在于这件事必须自主完成。正如当今世界虽有许多科技公司,但每家企业仍需要自己的IT部门,我们公司也有自己的IT团队,绝不会进行外包,未来这些部门将更加重要,因为他们要协助管理数字员工。这种模式将在每个国家、每个企业落地。正如Arthur所描述的,通过通用AI技术打造高度定制化的领域专家系统,无论是国家级AI专家、工业级AI专家,还是企业专属AI专家,这些功能型AI专家系统将构成未来AI发展的广阔蓝海。
Host: 我想确认自己是否正确理解了两位的观点。你们提到的是一种软性概念,类似于文化,即训练数据中蕴含的规范,并基于这些规范对模型进行定制。这似乎意味着,与计算、存储、网络等硬件基础设施不同,这类定制涉及的是抽象的文化层。
Jensen Huang: 你提到规范,这本质上是指一种软性约束,与更刚性的规则形成对比,而算法和法律则属于非常具体的范畴。
Arthur Mensch: 是的,在构建AI系统时,我们需要融入两种要素。一方面,某些风格化特征与知识储备并不适合通过刚性护栏强制实现,而是要通过持续的模型训练来塑造。比如,例如,将国家图书馆资源、文化偏好等提炼并融入模型自身。另一方面,企业内部的流程和政策必须是刚性的规则。通常的做法是将模型与这些硬性规则相连接,并确保每次调用时都能验证规则合规性。这本质上是两个层面的结合,一边是以柔性方式将知识灌注并压缩进模型,形成文化偏好层面的软性表达;另一边则是确保策略与规则被100%严格执行的刚性框架。所以在第一个层面,这是软性的,这是偏好,这是文化。
Jensen Huang: 偏好是多维度的,涉及海量特征参数。正如Arthur所描述的,只有AI才能精准捕捉并实现这种复杂偏好。试想若由人类用Python或C++编写规则,逐条定义诸如“基于A条件我倾向X,基于B条件则倾向Y”,其规则数量将呈指数级膨胀。这正是AI的独特价值,它通过全新的编程模型,能够系统化整合这些模糊性,将现实世界的复杂性编码为可执行的逻辑。
Host: 但听起来你是在说,AI不仅仅是计算基础设施,它也是文化基础设施
Arthur Mensch: 是的,正是如此。这是关于确保你公司或国家中的文化基础设施和人类专业知识能够融入到AI系统中。
Jensen Huang: 文化将反映价值观。我们刚刚讨论到,每一个AI模型、AI服务都会根据被提问的问题类型给出不同回应,因为它们将自身服务或公司的价值观编码到了每一项服务中。你能想象这种现象在国际范围内被放大后的情形吗?
Arthur Mensch: 对我来说,这揭示了集中式AI模型的内在局限性,即试图将普世价值观与通用知识编码进一个通用模型中。事实上,在特定场景下,必须基于特定员工或公民群体的偏好与需求,对通用模型进行定制化改造。这意味着要通过规则与文化偏好的双重路径,以软性和硬性的方式对模型进行专业化调整。这一过程既不能由国家外包,也不能由企业外包,而是必须自主掌控。
Host: 那么,如果说AI是文化基础设施,而我却不拥有其主权,这是否意味着现代数字殖民的风险已经迫在眉睫?如果AI被视为数字劳动力,而另一个国家或非主权实体能够决定我的劳动力能做什么、不能做什么,这显然是一个严重的问题。
Jensen Huang: 部分AI服务具有普适性。例如,某些公司能够为全球各国、社会和企业提供服务,因为这些服务本质上是通用的。然而,它不能成为唯一的社会结构,也不能是唯一的数字智能层,它必须与区域化特色相结合。就像麦当劳在全球各地都很受欢迎,肯德基和星巴克也是如此。但你仍然需要本地风格、本地味道作为补充,比如本地咖啡馆、家庭餐馆。因为这些定义了文化,定义了社会,定义了我们。
我认为沃尔玛遍布全球、值得信赖是件好事,但这并不意味着它应该取代一切。你仍然需要本地口味、本地风格、本地偏好、本地卓越以及本地服务。
也许让我换个角度来说,在未来数字劳动力的情景下,很可能会出现一些通用的数字员工,他们可能非常擅长执行基础研究或其他基础性任务,或者它们对每家公司都有用。我认为没有必要重新创造一些东西,Excel非常好,Microsoft Office在全球范围内都非常出色,我对它们非常满意。此外,行业专用工具和行业专业知识也至关重要。例如,我们使用Synopsys和Cadence。而Arthur不需要,因为这些工具专属于我们的行业,而非他的领域。我们可能都用Excel,都用PDF,都用浏览器,这些都是通用工具,我们可以共同受益。同样,也会有一些通用数字员工供我们使用。除此之外,还有行业专用AI和公司专用AI。
在我们公司内部,有一些对我们至关重要的特殊技能,它们定义了我们的独特性,甚至可以说是高度定制化的。这些技能高度专注于我们需要的任务,设置了严格的护栏,以完成非常具体的工作,完全契合我们公司的需求与专长,从而使我们在这些领域变得超乎寻常。你的数字劳动力和AI也将遵循同样的模式,有些是现成的,比如新的搜索工具可能是某种AI,新的研究工具也可能是某种AI,同时,也会有工业版AI,可能来自Cadence或其他供应商。而更进一步的,我们必须使用Arthur的工具来培养自己的AI,进行微调,使其达到卓越水平。
Arthur Mensch: 我非常同意这种愿景,即拥有一个通用模型,然后在行业层面进行一些专业化分层,接着在公司和国家层面进行更深层次的专业化,你将拥有一棵越来越专业化的AI系统树。举个例子,我们最近发布了一个名为Mistral Small的模型,它是一个通用模型,能够处理多种语言,并掌握广泛的知识。随后,我们基于它开发了一个专注于语言的专门化模型系列。我们增加了阿拉伯语和印度语等更多语言数据,并重新训练了模型,从而提炼出初始模型未曾接触的外部知识。通过这种方式,我们显著提升了模型在使用阿拉伯语和印度半岛语言时的地道表达。
语言可能是定制化模型的第一个切入点。关键在于,对于特定规模的模型,如果选择在某种语言上专门化,你可以获得性能更优的模型。例如,我们目前推出的24B模型,名为Mistral Saba,经过阿拉伯语调优后,其表现超越了规模是其五倍的其他大语言模型。这正是专门化的效果。这是第一层定制。接下来,你可以考虑垂直领域的定制。例如,如果你希望构建一个不仅擅长阿拉伯语,还能处理沙特阿拉伯法律案件的模型,就需要进一步的专门化。这意味着需要与相关公司合作,确保系统不仅能流利使用某种语言,还能理解该语言中的法律工作。这种逻辑适用于任何垂直领域与语言的组合。比如,你想要一个法语医疗诊断助手,它不仅要精通法语,还要掌握医生使用的专业法语。这些定制化工作,对于通用模型提供商来说是很难完成的。
Host: 如果这一观点成立,且你所描述的需求真实存在,即我需要能够基于本地规范和复杂本地数据定制AI层的能力,从技术能力的角度来看,你会如何建议一个大国思考我们正在谈论的技术栈,包括芯片、计算资源、数据中心、上层的模型、应用程序,以及最终你提到的AI护士或AI医生等应用?同时,你会如何为一个小国提供不同的建议?
Arthur Mensch: 我的建议是,你需要购买并搭建技术栈中的横向部分。你需要基础设施、推理原语、定制化原语、可观测性,以及将防护栏连接到模型、将模型与实时信息源连接的能力。这些原语在不同国家和企业之间具有较高的通用性。一旦具备这些可以采购的基础, 你就可以开始工作,开始构建。你可以从这些原因出发,根据自身价值观、专业知识以及本地人才进行开发。问题的关键在于,如何界定横向通用部分与垂直特定部分的边界。如果是一个小型企业或小国,可能应该购买横向通用部分,而垂直特定部分则必须自主构建。
Jensen Huang: 你得明白,这件事没有你想象的那么难。首先,因为技术正在变得更好、更容易。你能想象五年前做这件事吗?根本不可能。你能想象五年后做这件事吗?那会变得轻而易举。所以我们现在处于中间阶段。唯一的问题是,你是否必须做这件事。事实是,我讨厌员工入职,因为这需要大量工作。但一旦你建立了HR组织、领导力导师组织和流程,那么你入职员工的能力就会变得更容易,并且对每个参与者来说都更系统化、更愉快。起步总是困难的,这次也不例外。唯一的问题是,你是否需要做这件事。如果你想成为未来的一部分,而这是有史以来最具影响力的技术,不仅仅是我们的时代,而是有史以来最重要的数字智能。它还能有多大的价值?还能有多大的重要性?所以如果你得出结论,这对你很重要,那么你必须投入其中。尽早学习,边做边学,并且要知道,它正变得越来越容易。事实上,即使在三年前尝试构建Agentic系统也非常困难,但今天已经容易多了。所有用于管理数据集、入职数字员工、评估员工、为所有数字员工设置防护栏的工具都在不断改进。
另一个关键点是,技术速度的提升让一切变得更简单。你能想象早期的计算机吗?我有幸从计算机诞生之初就目睹它的发展,那时性能慢得令人抓狂,做任何事都困难重重。但如今我们做的事情简直像魔法,而且速度极快。无论你是被“参与人类史上最重要技术”的使命感驱动,还是单纯因为技术本身在不断进步,这件事其实没那么难。我认为,推脱的借口已经快用完了。
Host: 让我们花点时间讨论一下这个问题,毕竟变革总是艰难的。如果我是一个国家领导人,我面对的地缘政治风险不断增加,盟友关系难以捉摸,选举周期迫近,还有一大堆待办事项。但现在我意识到AI的重要性。你们经常与各国领导人交流,他们最担忧的是“采用AI过快的风险”。确实,巴黎人工智能峰会之后时代精神发生了变化,人们的基调比一年前的悲观更偏向乐观。但当这些国家领导人询问风险以及如何思考这些风险时,你们最常听到的问题是什么?
Arthur Mensch: 我听到几个常见问题,其中一个风险是民众因担心被AI取代而产生恐惧。这种风险其实可以通过确保全民接触AI技术并接受使用培训来预防。如果我们共同努力确保每个人都能接触到这项技术并接受使用它的培训,这种情况实际上是可以预防的。因此,普及到各个公民群体是极其重要的。将AI展示为一种让他们更好地工作的机会,并通过应用程序、通过他们可以在智能手机上安装的东西、通过公共服务来展示其目的。例如,我们正与法国失业救济机构合作,通过由人类操作员监管的AI Agents,将职位机会精准匹配给失业者。这种应用让民众直观感受到AI如何帮助他们更好地找工作,从而更容易接受技术变革。本质上,AI与90年代个人电脑、21世纪初互联网的普及类似,都需要人们主动拥抱技术。国家面临的最大风险可能是AI加剧现有的数字鸿沟。但若共同努力,以正确方式推进,AI反而能成为缩小鸿沟的工具。
Jensen Huang: AI是一种编程计算机的新方式。过去我们通过输入代码让计算机执行任务,现在你可以通过输入文字或对话让计算机完成任务。如今的交互方式更加多样化,让计算机为你做事变得比以往更容易。能够通过提示ChatGPT完成高效任务的人数,仅从人类潜力的角度来看,远超过过去能编写C++代码的人数。我们很可能已经缩小了技术鸿沟。
Host: 我们见过的最大的平衡器。
Jensen Huang: 从定义上讲,它是有史以来最伟大的技术平衡器。
Arthur Mensch: 但你仍然需要让公民了解它。
Jensen Huang: 我只是在陈述事实。如今用ChatGPT编程的人已经超过用C++编程的人数,这是不争的事实。AI已成为人类历史上最强大的技术鸿沟缩小器。正如Arthur所说,外界可能存在各种讨论,但现实是这股浪潮不可阻挡。当下ChatGPT的活跃用户数量惊人,我认为这非常棒。那些还在空谈其他事情的人显然没有真正投入其中。人们已经意识到AI的惊人能力以及它如何助力工作。我每天都在用,今天早上还在用。Arthur和全球计算机科学家们的深度研究成果令人惊叹,而用户数量的激增证明人们正在积极拥抱这项技术。
Host: 让我们来聊聊开源吧,因为你们两位都公开强调过开源模型在主权层面的重要性。比如你在DeepMind时期参与制定的Chinchilla Scaling laws,这些研究成果是你的联合创始人Guilam Llama公开的。去年,NVIDIA和Mistral合作训练了一个名为Mistral NeMo的模型。为什么开源模型成为你们关注的重点?
Arthur Mensch: 因为开源是技术民主化的基石。对于企业和国家而言,最终都希望在自己的基础设施上部署模型,而开放性从主权视角来看至关重要,这是第一点。第二点重要性在于,开源模型的发布能加速技术进步。我们创立Mistral的初衷,源自2010至2020年间AI发展的观察,当时各实验室通过互相借鉴成果推动技术跃进,但这种开放协作的飞轮在OpenAI发布首个大语言模型后逐渐消失。我们致力于重启这种开放生态,我们贡献某项成果,其他实验室在此基础上贡献其他创新,通过迭代推动整体进步。这也是我们创建Mistral的原因,我认为我们做得不错,因为我们开始发布模型后,Meta等公司也加入开源行列,中国的DeepSeek等企业也推出了更强模型,整个生态因此受益。
回到Mistral NeMo项目,开源模式下构建AI模型的一个难点在于,它更像“大教堂”而非“集市”模式,因为构建模型需要巨额投入。我们与NVIDIA团队的合作本质上是将两种模式结合,让双方团队在相同的基础设施、代码库上协作,共同解决问题并融合专业知识来构建同一模型。这种合作非常成功,因为NVIDIA带来了我们未知的洞见,我们也贡献了他们未曾掌握的技能,最终产出了当时同规模中最优的模型。我们坚信这种协作的价值,认为应该扩大合作规模,不仅限于两家公司,而是扩展到三到四家。这才是开源真正蓬勃发展的路径。
Jensen Huang: 我完全同意。开源的好处,除了加速并提升基础科学和通用模型、通用能力的发展,还在于它激活了大量利基市场和细分领域创新。突然之间,在医疗、生命科学、物理科学、机器人、交通等领域,因开源能力足够强大而被激活的行业数量令人惊叹。千万别忽视开源的惊人潜力,尤其是在边缘领域和利基市场。
Host: 数据可能涉及敏感信息的准入关键点。
Jensen Huang: 没错,比如采矿能源领域。谁会专门成立一家AI公司去开发矿业应用?能源确实重要,但能源开采本身的市场规模并不大。而开源能激活所有这些细分领域,从金融服务到其他行业,你可以挑自己感兴趣的领域。
Arthur Mensch: 任何涉及关键任务、需要自主部署的场景,包括可能需要边缘部署的场景,以及任何需要严格审计并具备全面评估能力的领域,如果你能访问模型权重而非仅依赖API,就能更彻底地评估模型。若你追求系统100%准确的确定性,就不应使用跨源模型。
Jensen Huang: 你必须将其连接到你的飞轮中。你将如何连接你的本地数据?如何将其连接到你的本地数据、本地经验中?你用得越多,它就会变得越好。没有开源,你无法做到这一点。
Host: 但假设我是一个国家领导人,我一直在考虑开源。我听到一些声音,比如开源对国家安全构成威胁。我们不应该出口我们的模型,因为这些开放模型实际上会泄露大量国家机密,或者更重要的是,坏人也可以使用这些开放模型。因此,这对安全构成威胁。相反,我们应该做的是将开发限制在两三个实验室之间,这些实验室拥有基础设施,可以从政府获得许可进行训练,进行正确的安全性和认证。我确实听到很多这样的说法。那么我该如何权衡这种观点与你们告诉我的观点(即开放模式对关键任务行业更有利)之间的关系呢?
Arthur Mensch: 实验室之间的协作对人类成功至关重要。如果一个国家选择封闭技术,唯一的结果就是另一个国家将取得领导地位,因为脱离开放的协同发展机制会极大削弱你的竞争力。这种做法并非没有先例,美国就曾有过这样的辩论。事实上,即便对模型权重实施出口管制,这既无法阻止欧洲各国,也拦不住亚洲国家继续推进技术发展。它们会通过协作加速发展,我认为我们必须接受一个现实,即AI如同编程语言般属于横向基础技术,而所有编程语言都是开源的,所以AI也应当开源。上周举办的AI峰会上,这种开放共建技术以加速共同进步的认知已被列入重要议程,这令人欣慰。显然,开源技术仍有广阔的发展前景。
Jensen Huang: 这是不可能控制的。正如Arthur所言,软件根本无法被垄断,若你试图封锁,其他人就会创造出新的标准并成为主导。关键在于,开源是否更安全?开源带来了更高的透明度,让更多研究者和开发者能够审查技术成果。全球所有企业、所有云服务提供商都基于开源技术搭建服务,正是因为开源是目前最安全的技术范式。试问今天哪家主流公共云服务的基础设施栈不是建立在开源之上?你可以基于开源进行定制,但开源的核心优势在于汇聚众人之力,更重要的是严格的代码审查。开源社区不容许随意提交低质内容,只有经过严格审核的优秀成果才能被接纳。这种协作机制加速创新、提升技术高度、确保透明度、吸引监督力量,所有这一切都在增强安全性。
Host: 换句话说,你是指开源技术(如数据库、存储、网络、计算)通过大规模红队测试提升了安全性,因为全球开发者都能参与攻防测试,这相当于全世界的技术力量都能帮你进行红队测试,而不仅仅是公司内部的一小群研究人员?
Jensen Huang: 是的,完全正确。
Arthur Mensch: 通过汇聚众多组织的力量共同开发技术,各参与方可在自身领域进行专业化定制,你实际上在迫使这项技术必须满足所有参与方的需求。这意味着你正在消除偏见,确保构建的通用中文模型尽可能完善且避免系统性缺陷。从这个角度看,开源也是减少技术故障的一种方式。如果作为一家公司,我决定完全依赖一个组织及其安全原则,以及其红队组织,这本质上是一种过度信任。而如果我在开源模型的基础上构建我的技术,依赖的是全球开发者共同确保技术基底的可靠性。这种去中心化的信任机制显著降低了单点故障风险,无论是企业还是国家,你都需要这样做。
Host: 现在我们要稍微转换一下话题,聊聊公司建设,很多人对你们两位这方面的见解都很感兴趣。Jensen,先请你谈谈。你曾说过NVIDIA是世界上最小的“大公司”,是什么让你们能够以这种方式运作?
Jensen Huang: 我们的架构设计有几个核心考量。它被设计成能在一个充满变化的世界中灵活适应,无论这些变化是我们主动引发的,还是外界环境施加的,背后的原因是技术迭代极快。如果你过度强调“可控性”,就会削弱系统敏捷应变的能力。我们公司会用“对齐”这样的词,而避免使用"控制"这种表述。回想起来,我几乎从未用“控制”这个词描述过公司运作方式。我们追求最小化官僚主义,尽可能让流程保持轻量化。所有这些设计原则,最终都是为了提升效率、增强敏捷性等关键目标。
我们尽量避免使用诸如“部门”这种表述,当NVIDIA刚起步时,谈论部门划分是种流行做法。但我厌恶“分割”这个概念,为什么要创建本质上彼此分割的组织?我同样排斥“业务单元”这种说法,因为凭什么要让任何部分孤立存在?为什么不尽可能整合公司资源?我希望构建一个更像计算单元般运作的系统,像计算机那样以最高效的方式输出成果。我们的组织架构看起来有点像计算堆栈。关键在于,我们要打造什么样的机制?我们希望在怎样的环境中生存?是类似宁静的乡村,还是混凝土丛林般的残酷环境?所处环境决定了你应该构建与之匹配的系统类型。最让我感到奇怪的是,每个公司的组织结构图看起来都差不多,但它们实际运作方式却完全不同,有的是蛇,有的是大象,有的是猎豹。在这个商业丛林中,每个企业本应具备独特形态,但现实中它们的架构和层级设置却完全雷同,这种同质化现象实在难以理解。
Arthur Mensch: 我认同公司确实有各自的“特性”。虽然组织架构有时看似相似,但显然我们还有很多需要学习的地方,毕竟公司成立还不到两年。我们现在存在着挑战,但我认为竞争对手们也面临同样挑战,作为首批真正由科学驱动的深度科技软件公司,我们的研发周期与传统软件公司截然不同。你需要按月推进,但有时无法精确预判技术突破的时间点。而客户却在不断追问“下一个模型何时发布”、“某功能何时上线”等具体问题,这就需要高超的预期管理。对我们而言,最大的挑战在于协调产品需求与科研能力之间的铰链关系,这需要让科研团队不完全陷入产品实现的泥潭。目前我们正在建立多频协同机制,在项目端保持每周迭代的高频节奏,而在科研端则保持低频深度思考,系统分析产品在特定领域的表现根源,通过新数据、新架构、新算法等科研手段寻求突破。这种双频共振的运营模式具有开创性,在传统科研机构中难觅踪迹,因为这本质上是个科学探索与商业落地的融合命题。
Host: NVIDIA是少数能在30年发展历程中持续保持科学与研究领先地位的成功企业,无论是2012年奠定基础的CUDA系统研究,还是如今被视为行业标杆的Cosmos模拟技术,这套系统重新定义了数字仿真应该如何运作。
Jensen Huang: 我们和Arthur刚才所说的内容一样。
Host: 这是启发式的吗?
Jensen Huang: 没错。我们在内部实现了这种动态平衡,基础研究、应用研究、架构探索、产品开发等多个层级都是必不可少的,环环相扣。每个层级都有独立的时间节奏,基础研究的迭代周期可能长达数年,而产品开发端却有成千上万的客户依赖我们的精准交付。关键在于,我们既要保留探索未知的科研自由,而那些可能带来惊喜的突破往往源于此,又要在商业化层面兑现承诺。这两个看似矛盾的维度,我们在运营中实现了和谐统一。
Host: 这个市场有太多有意思的地方,但有一点特别想指出来。你们两个都有客户同时也是你们的竞争对手。这些竞争对手都是规模庞大、资金雄厚的科技巨头。NVIDIA把GPU卖给AWS,而AWS正在开发自己的芯片Tranium。Arthur,你通过AWS和Azure出售的训练模型,而这些公司又资助了Anthropic和OpenAI这样的实验室。所以你们如何在这样的环境中胜出?又该如何管理这些关系?之前我们讨论过公司内部建设,但现在我好奇的是,在外部这样的情况下,你们要怎么生存下来?
Arthur Mensch: Jensen说得很对,你放弃控制权,但要在对齐上下功夫。尽管有时候某些公司可能成为竞争对手,但你们会有共同的利益线,可以在双方一致的具体议程上展开合作。
Jensen Huang: 你必须有自己的立足点。但显然,这些云服务提供商和Arthur合作并非因为它们已经有了同样的东西或者因为它们只是想要两个同类产品,而是因为Arthur和Mistral在世界上有独特的定位,在特定领域创造了独有的价值。今天我们讨论的许多领域,比如Mistral的工作及其全球定位,正是它们特别擅长的方向。我们与他们不同,我们不只是另一个ASIC,我们能为云服务提供商做它们自己无法完成的事情,也能与云服务提供商共同完成一些任务。例如,NVIDIA的架构存在于所有云端,并在许多层面发挥作用。我们是未来优秀初创公司的第一接入点,原因在于,通过接入NVIDIA,这些公司无需在战略或业务层面对某家大型云服务商做出承诺。它们可以进入所有云端,甚至在未来经济更有利时选择自建系统,或者获取那些在云端受到一定保护的能力。
无论出于什么原因,要成为优秀的合作伙伴,你必须拥有独特定位和独特价值主张,我认为我们具备这一点。甚至对与我们竞争的人而言,我们的全球地位都至关重要。当我们对此感到自在、对自己有清晰认知时,我们就能成为所有云服务提供商的优质合作伙伴,并真心希望它们成功。虽然听起来有些奇怪,毕竟你视它们为竞争对手,但关键在于,我们并不将其视为竞争者,而是“恰好也会与我们竞争的协作者”。我们为所有云服务提供商做的最重要的事,就是为它们带来业务。这正是优秀计算平台的价值,我们为人们创造商业机会。
Host: 我还记得第一次和Arthur见面时,我们坐在伦敦的深夜餐厅里勾画他的A轮融资计划。当时我们试图理解为什么这轮融资需要这么多资金,现在回头看,这笔资金使用效率惊人。Mistral的A轮融资规模是5亿美元,而其他公司需要花费数十亿美元才能达到相同高度。当我问他,你希望在什么芯片上运行模型时,你当时的眼神仿佛在说,这问题除了NVIDIA H100还能有什么答案?而你们投资的初创企业生态确实为云服务商创造了巨大价值。究竟是什么哲学驱动着你们在所有人都不了解这些初创企业时,就如此深度投资创始人和早期项目?
Jensen Huang: 有两个原因。第一,我很少称我们为GPU公司。虽然我们生产GPU,但我认为NVIDIA本质上是一家计算公司。作为计算公司,最核心的关注点永远是开发者,若只是芯片公司,关注焦点就仅限于芯片。我们所有的战略、行动、优先级、聚焦点以及投资,百分百都以开发者优先的态度为准则。这等同于说计算平台优先,换个词就是生态系统优先。一切都从这里开始,也在这里结束。GTC本质上是开发者大会(ZP注:3月17日至21日在美国加州圣何塞举行的 GTC AI大会),公司内部所有举措都以开发者为核心。这是首要原则。
第二,我们当时正在开创一种新的计算方法,这种方法在通用计算的世界里非常陌生。这种加速计算方式曾显得格格不入且反直觉,甚至长期被视为笨拙路径。我们持续寻找那些必须通过加速计算才能实现的下一个突破性应用,那些非加速不可的难题。主动发掘像Arthur这样的研究者和伟大思考者,对我来说是顺理成章的,因为我需要找到下一个杀手级应用。这本质上属于创新者的本能。如果还有未被我们合作的顶尖计算机科学思想家,那就是我的失职,必须立刻补救。
Host: 从计算视角来看,你认为未来最重要的趋势是什么?特别是,如果面对一群可能是国家领袖,例如首相、总统、信息技术部长,或身处全球快速增长市场的决策者,他们试图了解计算的未来方向,你会如何指导他们?
Arthur Mensch: 我们正朝着越来越异步化的工作负载方向发展。也就是说,你将任务交给AI系统后,可能需要等待它进行长达20分钟的研究才能得到结果。这种模式正在改变你对基础设施的考量,因为它会产生更大的负载。所以这对数据中心和NVIDIA来说是个利好组合。就像我在本期开头说的,如果缺乏为Agents设计的适配基础设施,如果AI系统没有正确途径去理解并学习与其交互的人类,这一切都不可能实现。未来几年,从人类交互中学习的能力将变得至关重要。另一个关键点是个性化,通过模型和系统整合用户画像,使其效用最大化。我认为我们正处于这个领域的早期阶段,它将深刻改变人机交互方式,未来机器会更了解我们的偏好,并知道如何为不同人提供最精准的服务。
最后我想补充一点,作为一国首相或领导者,你必须重视教育,确保本土人才储备具备足够AI知识去开发专用AI系统。同时,还需要考虑基础设施,包括物理层面和软件层面。那么究竟需要哪些正确的基础架构?哪些合作伙伴能为你提供高效的Agent接入平台?这两个维度至关重要。如果同时拥有这些资源、人才和深度合作伙伴关系,你所在地区的经济结构将发生根本性变革。
Jensen Huang: 在过去的十年里,我们见证了计算的巨大变革,从手工编码到机器学习,从CPU到GPU,从软件到AI。我们跨越了整个技术栈。整个行业已经完全改变,我们仍在经历这一过程。未来的十年将会是令人难以置信的。当然,整个行业长期聚焦在扩展定律和预训练的重要性上,这当然重要且将持续重要。但现在我们进入了训练后阶段,这涉及思维实验、实践、辅导、训练等人类学习所需的全套技能。具有思考能力的Agentic系统和机器人系统即将成为现实,这确实令人振奋。这对计算的意义极其深远,也是我们近期投入的重点。人们惊讶于Blackwell架构相比Hopper实现了巨大飞跃,原因在于我们专门为推理优化设计了Blackwell架构,并且时机精准,因为突然间,“思考”成为了巨大的计算负载。所以这里存在一个基础的计算层。
下一层是我们将要看到的AI类型。除了现有的Agentic AI和信息型数字工作者AI,物理学AI正在取得重大突破,这类AI能够遵循并理解物理定律、原子规律、化学法则等科学原理,我对此非常期待,它将推动工业、科学、高等教育和研究领域的变革。然后,理解物理世界本质的物理AI,从摩擦到惯性,因果和物体恒常性,这些人类有常识的基本事物,而多数AI目前尚不具备这些认知。这有望催生大量具备深远意义的机器人系统,尤其是在制造业等领域。美国经济高度依赖知识型员工,而许多其他国家则以制造业为核心。对于各国首相和领导人而言,必须意识到AI即将对其核心产业,带来颠覆性变革,无论是能源还是制造业,这种转型已近在眼前,需保持高度警觉。
我想鼓励人们不要对技术过度敬畏。有时候,过度崇拜或过度敬畏某项技术,反而会让你不敢真正投入其中,甚至产生某种畏惧心理。正如我们今天讨论的,关于“AI缩小技术鸿沟”的观点需要被正视,这涉及至关重要的国家利益,你有责任积极参与其中。无论如何,未来充满激动人心的可能。
Host: 那真是太棒了。非常感谢你们两位抽出时间。
原视频:Jensen Huang & Arthur Mensch: Why Every Nation Needs Its Own AI Strategy
https://m.youtube.com/watch?v=Ww9SkW0Em58&t=2445s&pp=2AGNE5ACAQ%3D%3D
编译:Hedy Liu
文章来自于“Z Potentials”,作者“a16z”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner