美国东部时间 6 月 5 日,英伟达股票大涨 5%,刷新历史新高,市值突破 3 万亿美元,超越苹果,成为全球市值第二高的公司,仅次于微软(目前市值 3.15 万亿美元)。
这是英伟达首次突破 3 万亿美元大关,它也成为继苹果和微软之后,第三家实现这一里程碑的公司。凭借在 AI 芯片领域的垄断地位,英伟达股价今年以来上涨了逾 147%,去年累计上涨了近 240%。
前不久,黄仁勋与美国移动支付巨头 Stripe CEO 帕特里克·克里森(Patrick Collison)进行了一场企业家之间的深度对谈,不仅畅聊自己曲折的成长史、与 AMD 董事长兼 CEO 苏姿丰的亲戚关系,而且点名夸奖 Llama 系列模型的重大意义和自己日常爱用的 AI 工具。
黄仁勋还大谈管理经验,包括 60 位高管如何向他汇报、怎么安排日常工作、为何坚持不裁员,以及大家最关心的——这位兼具工作狂魔与魅力型领导者特质的创业者,当初如何做出卓有远见的判断,带领英伟达 2.8 万人走向伟大的成功?
以下是对 Stripe 深度访谈的完整编译(为提高可读性,我们调整了部分问答的顺序,并在不违背原意的前提下进行了一定的增删修改):
黄仁勋:有句话说,你应该根据你的兴趣来选择你的职业。通常人们会把兴趣和幸福联系在一起。我认为这个观点不能说是错误的,但忽视了一些重要的因素。
原因在于,如果你想要做伟大的事情、建立伟大的公司,必然是很不容易的。你并不总是享受这个过程。创业的过程中,我并不是每天都喜欢我的工作,也不认为每天都让我感到快乐。同时,快乐也不一定是美好的一天的定义。我每天都不开心,我每年都对公司不满意,但我每一秒都爱这家公司。
我认为人们常常有这样的误解,认为最好的工作是那些一直带给你快乐的事情。我不认为这是正确的。你必须受苦。你必须奋斗。你必须努力。你必须去做艰难的事情,并努力解决困难,才能真正意识到自己所做的事情有多伟大。
没有什么伟大的事情是容易完成的。因此,我祝福你们能实现伟大的成就。这句话用我自己的说法就是,我祝你们经历大量的痛苦和磨难。
帕特里克·克里森:你的这种观念是在成长过程中逐渐形成的吗?还是说你是天生就有这种性格?
黄仁勋:我是移民出身,当我在 1973 年来到美国时,我才 9 岁。我哥哥还不到 11 岁。这是一个陌生的国度,确实很不容易。
我们的父母对我们很好,但我们并不富有。他们工作很努力,时至今日也是如此。他们辛勤工作,言传身教,让我们学会了很多生活的经验和教训。
我做过各种各样的工作。我们上的学校包括还要做很多杂活。我刚到美国时被送去了奥奈达浸信会学院(Oneida Baptist Institute)。这可和麻省理工学院不一样。都叫学院,但意思不同。这是不同类型的学院。
我的学校是寄宿制的,我是里头最小的孩子。其他孩子都得做重活,得在烟草农场工作。而我得到了相对轻松的工作。当他们离开之后,我得清洁所有的厕所。我从不觉得自己得到了轻松的工作,因为厕所实在是太脏了。但那是我的工作,所以我便完成了它。
然后我还做过很多其他的工作,在丹尼餐厅(Danny's,美国连锁快餐店)的工作就是其中之一。我最初是个洗碗工,然后做清洁工,最后做服务员。
我热爱我的每一份工作。我不能说所有工作都很愉快。但我所做的一切,我都想做得很好。也许这是从一开始就根深蒂固的一个品质。但我敢保证,我绝对是世界上最好的厕所清洁工。
任何员工都没有信息特权
帕特里克·克里森:我们来谈谈现在的英伟达。你们的领导团队有多大,都直接向你汇报吗?
黄仁勋:英伟达现在的领导团队有 60 多人,他们都向我汇报,是我的直接下属。这种做法是很少见的,但我觉得这是最好的做法。
首先,我认为在公司里,信息的传播是十分重要的。我认为员工在工作上的贡献,不应建立在获取某些信息的特权这一基础上。我不会做一对一沟通。我的员工团队也很大。我在公司内部分享信息时,基本上所有人都能同时收到。
这么做的原因就是,我认为我经手的这些信息不应该只有一两个人知道,比如公司目前面临的挑战,亟待解决的问题,未来发展的方向。所有员工都应该能够获取所有这种类型的信息。我很喜欢这种模式,大家的信息都是一致的,公司里没有任何信息方面的特权,大家都能对公司面临的问题建言献策。
我的员工会议一般每 2 周进行一次,60 个人都要齐聚一堂。这些会议都是问题导向的。无论提出了什么问题,大家都会在同一时间处理这个问题,听到了问题为什么出现,为何选择这样的解决方案。这很能给员工赋能。我相信,当你给每个人平等的获取信息的机会时,这就能给员工赋能。这是第一点,利用信息给员工赋能。
第二点,如果 CEO 的直接下属是 60 人,那就能在公司里移除至少 7 个管理层级。当然了,这点不能一直推进到公司基层。因为越往下需要的管理也就越多。而如果你「不幸」成为了英伟达的高管,你就没那么需要他人的管理了。
帕特里克·克里森:我很少会支持传统的管理模式。但试想一下,一对一沟通能给员工很具体的指导,比如给他们分析目标、分析职业生涯的发展规划、给员工充足的反馈信息,告诉他们工作中有哪些问题。这些都是传统意义上的一对一沟通中会做的事情。那你是不是不会做这些事情,还是说你的做法不一样?
黄仁勋:这个问题很好。我就在会议现场做这些事情。我会在大家面前给你反馈。这点其实是特别重要的。首先,反馈就是一种学习。那为什么你应该成为唯一一个获取这些信息的人呢?你给我们创造了一个学习的机会,不论是犯了错误,还是犯蠢了。我们都应该从这个机会中学到点东西。
我会在大家面前分析某个问题,提出我自己的见解,这能帮助在场的所有人学会怎么分析问题。我认为一对一沟通的主要问题,就是它剥夺了其他人学习的机会。从错误中学习,特别是从他人的错误中学习,是最好的学习方式。
这就是为什么我们会做案例分析。我们就是要从他人的灾难和悲剧中学习知识。这可是我们最「喜闻乐见」的事情。我也反对英伟达的其它高管做一对一沟通。没有什么能比「老黄让我们这么做」,或者「某某高管让我们这么做」这类说法,更让我抓狂了。
帕特里克·克里森:你曾告诉过我,你真的不喜欢解雇员工,你也确实很少这么做。能详细讲讲背后的原因吗?
黄仁勋:是的,我宁愿帮你进步,也不愿放弃你。我曾经是个扫厕所的,现在我是公司的 CEO。所以我也认为,你什么都能学会。我相信你能学会生活中的很多事情,你只是需要一个学习的机会。我有幸观察很多聪明人做事情的方式。我身边就有 60 个人。他们可能自己都没有意识到我在观察和学习,但我其实一直都在向他们学习。
我不愿意放弃任何一个员工,因为我觉得我能帮助他们进步。我宁愿一直折磨他们,直到他们做出伟大的成就。我认为真正相信自己团队的领导,都愿意将他们折磨到伟大。
通常情况下,他们都很接近了。别放弃,真的很接近。成功有时候会在某一天突然降临。有可能你昨天还没有那种感觉,突然有一天就悟了,一下就想明白了。你能想象,在成功前的那个时刻放弃是什么感受吗?所以我不希望放弃,所以我就继续折磨我的员工。
帕特里克·克里森:你工作和生活的平衡做得怎么样?
黄仁勋:那就取决于你问谁了。我认为我的工作生活平衡非常好。真的很棒。我尽可能多地工作。我醒来的那一刻就开始工作,一直干到睡觉的那一刻。我每周工作 7 天。当我不工作的时候,我也在想工作。当我工作的时候,我就专心投入。
我能坐在那儿看完一整场电影,但什么也不记得。因为我脑子里想的全是工作。但我的工作不是不是去解决具体的问题,而是在思考公司能成为什么,有没有我们可以做得更好的事情。我无时不刻不在设想公司的未来。
帕特里克·克里森:黄仁勋的一天是什么样的?
黄仁勋:我以前 5 点就起床了。现在我 6 点起床。这主要是因为我家的狗。不知道为什么 6 点就变成它们起床的时间。我倒是不介意吵醒其他人,但叫醒小狗让我感到内疚。这都快变成一个负担了。我都不能发出任何动静,因为它们能察觉到房子里的任何震动,这会吵醒它们。所以我就待在床上读书,直到 6 点钟。但是我脑子里也想着 GPU。
帕特里克·克里森:一般来说,你一天要开多少次会议?
黄仁勋:几乎整天都在开会。我努力在正式上班前把我自己的工作做完,这样每天去上班的时候就主要在开会。我会选择对我真正重要的会议,尽量避免参加常规运营会议。因为我的公司里有很多了不起的人在做常规运营会议。
我们做 CEO 的应该是临时替补,应该处理其他人做不了或者没有做的事情。我参与的会议都是要可以真正推动事情发展的会议。我不会参加报告会议,也讨厌报告会议。我只会参加解决问题的会议,能提出新想法的会议,头脑风暴会议,有创造性的会议。那才是我会参加的会议。
我通常会主动召集这些会议。我非常努力地不让 Outlook 管理我的生活,而是有意识地决定想做什么,想处理什么事情。我尽量过有目的的生活,并据此管理我的时间。
帕特里克·克里森:你曾经用过一个词叫「0 亿美元市场」。你说「0 亿美元市场」是你最喜欢的市场。这句话是什么意思?
黄仁勋:退一步看,我们的目标,或者说几乎所有人的目标都应该是去做一些从未有人做过的事情,这是非常困难的。如果你实现了这些事情,那就可能对世界做出真正的贡献。我会尽力去做这些事情。如果有些事情以前从未被做过,也极其困难,那么这个市场的规模应该就是 0 亿美元。因为这件事以前从未被做过。
我宁愿成为一个市场的创造者,也不愿做一个市场中的掠夺者。要去创造一些以前从未存在过的东西,而不是考虑怎么抢占市场份额。我不喜欢考虑市场份额,也不喜欢份额这个概念。Stripe 就是凭空出现的,之前也没有类似的公司。「0 亿美元市场」也是一种很好的思维方式,能帮助公司思考要怎么样做好创新。
帕特里克·克里森:我们公司的使命是让整个互联网行业的 GDP 增长。有很多人会关注「互联网行业的 GDP」这个说法,但我认为「增长」是这个表述里最重要的部分。因为,正如你所指出的,我们不应该考虑已经发生的交易或者已经存在的业务。我们应该考虑哪些交易不存在,哪些业务不存在。世界的 GDP 大约是 100 万亿美元,但它不必只有 100 万亿美元。它可以是 200 万亿美元或 1000 万亿美元。
黄仁勋:这完全正确。而且,我们在未来几十年将要创造的大部分价值,很可能不会受到物理事物规律的限制。这是一个不同寻常的时代。
帕特里克·克里森:现在我们刚好谈到这个「0 亿美元市场」的概念。如果我在英伟达,我带着一些项目提议来找你,可能涉及到数亿美元的资本支出,或者需要多年的投入,现在也没有客户需要这个产品,无法展示有什么需求。那你们在这些事情上的决策方式是不是凭直觉的呢?
黄仁勋:非常接近。这是一种直觉上的判断,或者说直觉提供了一个起始假设。但你必须通过逻辑推理来证明这个事情的可行性。对我来说,推理比电子表格更重要。我讨厌电子表格,因为你可以随心所欲地使用电子表格。你可以用电子表格制作任何你想要的图表,你只需要输入一些数字就行。
我更喜欢文字,因为文字展现了你的推理过程。我可能会问你,告诉我,你是如何逻辑推理的?你的直觉是什么?你为什么相信这很重要?你为什么认为这很难?
我喜欢困难的事情,因为这需要很长时间来做。如果它需要很长时间来做,很多不那么坚定的人可能不会去做。如果它真的很难做,需要很长时间来做,那就需要一个非常坚韧、专注和坚定的人去追求这个目标。可能好几年都会在原地徘徊,没有人会注意到你。
帕特里克·克里森:CUDA 这个想法一开始是怎么来的呢?
黄仁勋:CUDA 源自于两个想法。其中一个叫作加速计算。英伟达开创了这个叫做加速计算的概念。加速计算就像是一个 I/O(输入/输出)设备,如果你在计算机行业,它是一个你放在 PCIe 上的 I/O 设备,允许应用程序以加速计算的方式与 I/O 设备交互。
UDA(Unified Driver Architecture,统一驱动架构)是在 1993 年发明的,它是一个影响深远的发明。它允许软件程序员直接编程 I/O 设备,直接给 I/O 设备写应用程序。这是因为 I/O 设备是虚拟化的,并且多代之间在架构上是兼容的。
总之,我们发明了这个叫做加速计算的概念,我们称它为 UDA。然后几年后,我们认为我们可以使我们的 GPU 对高级编程语言更具可编程性。所以我们发布了 CG(C for Graphics),也就是为 GPU 编程设计的高级着色器语言。但由于种种问题,最终发布了 CUDA(Compute with Unified Driver Architecture)。总之是个非常曲折的故事。
帕特里克·克里森:我想真正的问题是,CUDA 有没有一夜爆火呢?
黄仁勋:不是的。CUDA 的发布可以说是一场灾难。虽然我们追求的是一个「0 亿美元市场」,但追求这个市场的成本太高了。它实际上摧毁了我们原本拥有的十亿美元市场。原因是因为我们的芯片中加入了 CUDA,增加了大量成本,但是没有应用。
没有应用,客户就不会重视这个产品,他们不会为此支付溢价。如果人们不愿支付,而你的成本上升了,那么你的毛利率就会受到挤压,我们的市值就会下降,然后真的变得非常低。我想我们的市值降到了大约 10 亿美元左右。我真希望我当时买了自家的股票。
帕特里克·克里森:所以你们需要取消 CUDA,然后回到原来的战略吗?
黄仁勋:不是的,我一直相信 CUDA。因为我已经推理过了。我们真的相信加速计算能够解决普通计算机无法解决的问题。如果我们想将架构扩展得更加通用,我们就必须做出这个牺牲。
我深深地相信我们公司的使命,相信公司未来的机会。我也坚信其他人都错了,他们只是不懂得欣赏我们所建立的东西。我深深地相信这些东西。
帕特里克·克里森:那你要如何回应分析师、董事会和员工的质疑呢?你摧毁了这个现有的收入流,炒作了一个宏伟的梦想,但似乎没有人真的想要。生意也变得很糟糕。你要怎么办呢?
黄仁勋:我只需要告诉他们,其他人都太笨了,否认现实就行(笑)。这是玩笑话,我们还是得回归到自己相信的东西上。
帕特里克·克里森:董事会在这期间有给你压力吗?
黄仁勋:我每次和他们对话都是从我自己深信不疑的事情谈起。他们也确实相信我的说法,因为他们看到我自己深信不疑。我也向他们推理分析了这些问题。要让他们相信,必须依靠推理。
帕特里克·克里森:CUDA 最终的成功花了多久呢?
黄仁勋:大概 10 年吧。没有那么长。10 年而已嘛,一下子就过去了。
帕特里克·克里森:不到你任期的三分之一。
黄仁勋:是的,时间过得很快。我几乎不记得期间我经历的痛苦了。
帕特里克·克里森:英伟达没有 CUDA,还能在 AI 领域取得今天的成功吗?
黄仁勋:不,这是不可能的。这可能是现代计算中最重要的发明之一。我们发明了这个叫做加速计算的概念。这个想法很简单,但非常深刻。它的意思是一小部分代码占用了运行时间的 99.999%。这对于许多非常重要的应用程序来说都是事实。而那几个核心可以被加速。CUDA 不仅仅是并行处理,没这么简单。这个想法的本质是我们可以加速那些核心和软件片段。
现在,当摩尔定律已经走到尽头,CPU 的性能提升基本上已经停止了。如果我们不加速软件,就会面临计算成本的膨胀。因为世界计算量仍然在每年翻倍增长,如果 CPU 和通用计算机的性能无法提升了,那么会发生什么呢?计算成本将继续指数级上升。现在轮到我们去做计算了。
关键要做好决心与固执间的平衡
帕特里克·克里森:在场的各位都是企业家,也许每个人自己心中都有和 CUDA 一样类似的愿景。他们认为这对他们的领域或他们的技术非常有意义,但市场还没有看到它的潜力。你认为有没有可能从中提取一些通用的原则呢?什么时候应该坚定地相信你的愿景,什么时候又需要重新考虑呢?
黄仁勋:是的,问题的关键是决心与固执之间的界限。那条界限是模糊的。我每天都在确认我的核心信念。我现在仍然这样做。我需要确认我分析公司战略时使用的第一性原理是否正确。这不是一个很长的列表,很容易记住。
问题的关键是,这些原则现在是否有了根本性的改变呢?外部条件的变化是否使它们不再像以前那样重要?是不是有人解决了这个问题?这个问题现在已经消失了吗?是不是还会有需求?你必须不断检查。这是其一,不断自省。你必须非常小心地提炼基本原则,而不是说我就想这么做。这种想法就是固执了。我们不是 5 岁的孩子,所以你必须做好推理分析。
第二,必须要聪明一些。我们找到了一些方法将 CUDA 变现。我们到处寻找应用场景,找到了 CT 重建的应用,找到了地震信号处理的应用,找到了分子动力学的应用。我们不断地寻找应用场景。这些应用没有让我们大获成功,但至少足以让我们维持公司运转,为我们赢得了时间,让我们能撑到成功的时刻。
帕特里克·克里森:让我们来谈谈 AI。假设今天世界上所有 GPU 的总计算能力是 X。你认为,5 年后我们的总算力会是 X 的多少倍?
黄仁勋:我要是说出来我肯定会后悔的。我们可是一个上市公司。你这个「疯子」,你们这种私有公司可真是自由自在。好的,让我们来分析一下。首先,世界已经安装了大约 1 万亿美元的数据中心。这些数据中心使用通用计算。通用计算已经没有未来了,所以我们不能再这样处理数据。世界需要加速计算,需要将加速计算应用到所有领域。当我们加速一切时,每一个数据中心、每一台计算机都将是一个加速服务器。假设市场不增长,未来 4 年我们要替换大约 1 万亿美元的计算机。
但如果计算机行业继续以大约 20% 的速度增长,我们可能需要在未来几年将大约 2 万亿美元的计算机替换成 GPU。这是第一点。
第二点,这也是为什么我认为你们的行业潜力无限。这是一场工业革命,让我告诉你为什么。我们正在大量生产一些以前从未生产过的东西。生产这些东西需要一种以前从未存在过的设备,也就是 GPU。我们现在首次大量生产的东西就是 token 和浮点数。这些东西的价值就在于它们代表着智能。这就是人工智能。
你可以将这些浮点数以某种方式重新组合,它就能变成英语、法语、蛋白质结构、化学物质、图形、图像、视频、机器人的动作、方向盘的动作。我们正在以极大的规模生产 token。我们在人工智能方面不断努力,最终发现了一种生产几乎所有类型的 token 的方法。世界将生产大量的 token。这些 token 将在新型数据中心中生产。我们称它们为 AI 工厂。
回到上一次工业革命。水进入一台机器,把水烧开变成蒸汽,然后驱动发电机产生电力。原子进,电子出。而在这场新的工业革命中,是电子进,浮点出。上一次工业革命中,没有人明白为什么电这么有价值。而现在电力被出售、市场化。每千瓦时的电力被标上价格。现在 token 也被这么标上价格了,每 1 美元对应着多少 token 数。
就像上一次工业革命那样,这些事情对很多人来说都很难理解。但在未来 10 年这会变成人们司空见惯的事情。这些 token 将创造出新产品、新服务,提高整个行业的生产力。建立在我们产品基础上的产业,价值可能有 100 万亿美元。这个行业的前景是很广阔的。
帕特里克·克里森:这些 token 工厂的一个大问题是模型是否会饱和。我们现在可以用自然语言编写它们,将自然语言转换为 SQL。从 70 亿参数的模型发展到 700 亿参数的模型,这种进步对于用户查询的准确性可能具有重大的改进。但或许发展到比这个规模还要大 10 倍的模型是不必要的?在某种程度上来说,目前的模型是不是已经足够好了,可以可靠地将自然语言转换为 SQL?
你认为 LLM(大语言模型)部署用例的饱和曲线是什么样的?什么样的用例才需要万亿参数模型或十万亿参数模型?还是说千亿参数的模型就够了?你对这个问题有什么看法吗?或者说我们能这么看待这个问题吗?
黄仁勋:好的,让我们把问题分解,然后推理一下。我们从一个例子开始。2012 年,计算机视觉领域的 AlexNet,在 ImageNet 图像识别的准确率大概是 82%。在接下来的大概 7 年里,每年的误差都减少了一半。这其实就是摩尔定律。每年的准确性提高了 1 倍,可信度也提高了 1 倍。在 7 年的时间里,它实现了超越人类水平的表现。
同样的事情也发生在语音识别和自然语言理解上。这个行业将不断追求更高的准确性和可信度。我相信在自然语言理解领域,我们也会看到类似的进步。当然,这些问题要复杂得多。但我坚信我们能将准确性每年提高一倍,直到它非常准确。目前在许多情况中,和模型交互时我们都感到答案很准确,值得信赖。在这种信任是尤为重要的。
第二点,目前的 AI 都是一次性生成内容的(one-shot)。但我们都知道,有许多事情是不能一次性就想明白的,需要不断迭代自己的想法。所以,我们要怎么样才能让 AI 也能够自己做好计划呢?怎么让 AI 自己构思一个解决问题的方法呢?
这可能需要工具,需要看一些版权数据,需要做研究,需要去问另一个 Agent,需要问另一个 AI,可能还需要人类的参与。比如问问人类的意见,发起某个事件,比如主动发邮件或者发消息给某人。然后才能进行计划的下一步。所以大语言模型必须学会规划并不断迭代计划。不能一次性就把事情都做好了。
当它做好计划时,还需要启动其它的模型一同合作解决问题。我认为未来的模型将会拥有自我迭代的能力,成为能利用其他具有特定技能的模型的计划模型。所以我认为我们还有很长的路要走。
Llama 实现了生成式 AI 民主化
帕特里克·克里森:Meta 因为发布 Llama 3 而备受关注。这似乎是迄今为止最令人印象深刻的开源模型。你对开源模型有什么看法?
黄仁勋:如果你问我在过去几年中最重要的事件是什么,我会告诉你当然是 ChatGPT 的出现、基于人类反馈的强化学习,给模型融入人类价值观的相关技术。这些显然是重要的突破,当然还包括计算的民主化。这使每个人都可以成为程序员。现在每个人都能用它做一些令人惊叹的事情。我真的为 OpenAI 的团队感到骄傲。
第二件事也同样重要。我认为是 Llama。不是 Llama 1,而是 Llama 2。Llama 2 让几乎所有行业都开始研究使用生成式 AI 技术。它让各行各业都能够接触到这项技术,包括医疗健康、金融服务、制造、客户服务、零售等等行业。因为 Llama 2 和 Llama 3 是开源的,所以能吸引研究者、初创公司和其它行业使用这项技术。Llama 系列模型普及了生成式 AI。我认为这点也意义重大。
我认为 ChatGPT 实现了计算的民主化,而 Llama 实现了生成式 AI 的民主化。没有 Llama,很难实现目前和 AI 相关的安全研究、各种推理技术以及强化学习的研究。
先界定问题才能解决问题
帕特里克·克里森:Dario Amodei(Anthropic 公司 CEO)两周前在 Ezra Klein 的播客上预测 AGI 会在近期内实现。可能就是在未来几年内,比如 2027 年这个年份就经常被提及。你怎么看?
黄仁勋:这取决于你如何定义 AGI,首先,作为工程师,我们知道要先界定问题才能解决问题,必须以某种可衡量的方式表达问题和陈述任务。
如果说 AGI 的定义就是能完美通过我们目前的一系列基准测试,比如数学测试、英语理解测试、推理测试等等,还有医学考试、律师资格考试等等。不管你列出什么目标,我都相信我们将在非常短的时间内取得优异的成绩。如果那就是 AGI 的定义,我猜测它很可能在未来 5 年内实现。因为目前模型在这些测试上,每半年错误率就能减半。我们没有理由不相信它不能很快实现超越人类的表现。
但是在座的各位要注意,这并不符合大多数人对 AGI 的想象。我从工程的角度这么定义 AGI,只是为了我能回答这个问题。那如果 AGI 的定义尚不明晰,又怎么能回答这个问题呢?
想把英伟达变成巨大的 AI
帕特里克·克里森:在座的各位都是企业主。他们都面临着一个特别实际的问题,在你所描述的那种变化面前,一个人要怎么知道自己是否做出了恰当的、充分的、正确的反应呢?你有什么建议吗?
黄仁勋:如果你不积极、主动地参与 AI,那你就是在犯错误。你不会因为 AI 技术本身而失业,而是会因为使用 AI 的人失业。你的公司不会因为 AI 技术本身而倒闭,而是会因为另一家公司使用了 AI 而倒闭。这是毫无疑问的。因此,你必须尽快参与 AI,这样你就能做那些你认为成本太高而无法做的事情。
如果智能的边际成本实际上接近于 0,你就会去做很多你本来根本不可能做的事情。我们现在搜索的频率,提问的频率都是特别高的。我平时遇到一个问题就扔到 Perplexity 里问问答案。即便有时候我已经知道答案,我也会问一下,以防万一。我们希望将这类行为的成本降到最低,这样大家便可以随心所欲地使用这些服务。
第二点,AI 可以用来提高公司的生产力。生产力高的公司会带来更高的收入,而更高的收入会带来更多的就业机会。更多的就业机会则会带来更多的社会进步。因此,我们很有必要用 AI 推动公司生产力的提升。
帕特里克·克里森:除了影响你们的制造计划和资本支出计划之外,AI 是如何改变英伟达内部的运作方式的?
黄仁勋:我们是最早投资建设自有 AI 超算的科技公司之一。如果没有 AI,我们就无法设计芯片。在夜间,我们的 AI 正在探索我们自己永远无法探索的种种可能的设计。因为要人工探索这些设计需要花费太多资金了。有了 AI,我们的芯片变得更好了。我们能够降低我们芯片的能耗,性能也更好了。
如果没有 AI,我们也无法编写软件。优化编译器的设计也十分复杂。我们会使用 AI 来提交错误报告。我们的错误数据库会告诉你代码出了什么问题,可能涉及哪些人,并让相关人员去修复它。
我想要英伟达的所有人都大量使用 AI 工具。我还想把整个公司都变成一个巨大的 AI。这样一定会很棒,那我就能做好工作和生活的平衡了。
帕特里克·克里森:你有没有听说过哪些企业,在意想不到的领域做出了一些意料之外的用例呢?
黄仁勋:我认为 AI 最大的惊喜的就是,当我们称之为大语言模型时,「语言」这个词包含的不只是人类的自然语言。如果 AI 模型能学会语言,那它也能学会操纵机器人的关节运动。这些本质上都是一些序列而已。我们只需要找到将这些操作 token 化的方式就可以了。其实对模型来说,一切都是可学习的。所有的这些专有编程语言,比如 SQL、ABAP、Lightning、Verilog 都是可学习的。这意味着我们能给地球上的所有工具都加上一个 Copilot。
帕特里克·克里森:你认为未来是会有成千上万个单独的模型,还是只有一个万能的超大模型呢?
黄仁勋:我认为拥有一些超级模型来帮助我们进行通用推理是非常好的。但对于我们,对于那些拥有特定领域专业知识的公司来说,我们必须训练我们自己的模型。这么做是因为这类公司拥有一套自己专属的「语言」。而 99% 和 99.3% 之间的差异对我们来说就是生死攸关的区别。
专有模型对我们来说太有价值了。无论通用模型有多好,我们都需要进行微调和改进,直到它们能实现完美的表现。因为这些内容实在是太重要了。
非常了不起,小时候不认识
帕特里克·克里森:时间快到了,但我还有很多问题没问。但有一些问题我真的很想问问答案。苏姿丰(AMD 董事长兼 CEO)是你的远房表亲吗?
黄仁勋:是的,她太棒了,非常了不起。顺便说一下,她是 AMD 的 CEO。
帕特里克·克里森:AMD 在 GPU 领域是你们的竞争对手之一。
黄仁勋:不,我们是一家人。我们都是这个行业的。我们还从 AMD 采购呢。
帕特里克·克里森:到底是怎么回事儿呢?为什么最大的两家 GPU 公司居然是由一家人运营的呢?
黄仁勋:我不知道这是怎么发生的。我们没有一起长大,彼此也不认识。我们是在她在 IBM 工作的时候才认识的。她的职业生涯令人难以置信,真的非常了不起。
现在没有青春痘就没资格创业
帕特里克·克里森:你从 90 年代初就开始在硅谷摸爬滚打了,你认为硅谷文化在这段时间里发生了哪些变化呢?
黄仁勋:哇,我很久没想过这个问题了。有一点是,当我刚开始创业时,我才 29 岁,脸上还有青春痘。当我去找律师事务所和风投公司时,我额头上还有一个大痘痘。那时候,作为一个年轻人,你会感到相当忐忑。那时候的大多数 CEO 都穿着西装,成就颇丰,举止言行都是大人的模样。他们用着一些大词,谈论着商业上的事情。创业者年轻的时候去见这些人会感到相当害怕,因为你被一群成年人包围着。
而现在,如果你脸上没有青春痘,恐怕都没有创业的资格。这是一大变化。这一文化上的转变让年轻人也可以有所成就。年轻一代的 CEO 所知道的东西实在是太多了,而我学习这些知识花了几十年。
帕特里克·克里森:最后一个问题,英伟达的市值是 2 万多亿美元,现在你们离苹果和微软的市值只有一步之遥。我刚刚查了一下,他们分别有 22 万和 16 万名员工。而英伟达仅有 2.8 万名员工,还不到其中较小的一个的五分之一。
我们刚才在后台聊天时,我记下了这一点,你可以通过流程实现卓越的运营,但只有资历才能实现卓越的工艺。英伟达比其他巨头要小得多。你们对员工的资历比较重视,能详细谈谈这一点吗?
黄仁勋:我认为卓越的运营可以创造出不错的东西,但仅通过卓越的运营无法创造出非凡的事物。许多伟大的事物,比如你创造的产品、公司和组织,是需要爱和呵护的。你甚至无法用言语表达,怎么可能在电子邮件中把爱和呵护表达清楚呢?爱和呵护是无法融入商业流程中的。爱和呵护是我在英伟达内部很常用的表达。我必须使用这些表达,因为没有其它的说法。这些概念不能用数字来表示,也无法在产品规格中写出来。我们无法在产品规格说,要做出一些具有美感、工艺精湛的产品。
帕特里克·克里森:我在 Stripe 也总是在谈论工艺和美感。我希望事物具有这些难以言喻的特征,但其实它并不直接满足某些客户的需求。客户不会来找我们说,我希望产品更美。他们会说,我希望它具备特性 X 或特性 Y。然而,我们相信工艺和美感真的很重要。你似乎也这么认为。你为什么认为这些东西很重要呢?
黄仁勋:实际上,即便你的客户没有将这些需求说出来,但当他们真正使用这些产品后,他们就体会到了。毫无疑问,Stripe 的产品具有美感,十分优雅简洁,简洁而不简单。简洁和简单不是一回事,它解决了问题,但恰到好处。它给你负担,但不会太多。找到这种平衡很难,我们无法具体说明,只能凭着直觉前进。
当我们逐渐培养出一支团队时,团队内部的感觉是基本一致的。其实我们已经将团队的感觉内化了,这些感觉是言语无法形容的。我们不想失去这些东西,而是想进一步发展这些特质。所以我不愿意重置,这也是为什么我不太愿意和新人一起工作。因为我已经习惯了这些东西,我已经与团队一同经历了如此多的痛苦和快乐,学习了许多的知识。所有这些经验已经内化到团队里了,而我想继续传承和发展这些东西。
这就是为什么我十分相信资历的力量。正因如此,小团队也可以实现伟大的事情。和其他企业相比,英伟达就是一个小团队。我们只有 2.8 万人,但做出了远远超出我们体量的成就。
文章来自于微信公众号Founder Park ,作者陈骏达
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner