图片来源:Radical Ventures
Leah:我是Radical Ventures的社区经理,同时也是我们Radical AI创始人大师班的主持人。在整个AI创始人大师班的过程中,我都会和大家一起。今天是我们的第一节课程,很高兴能开启这个旅程。现在我很高兴为大家介绍Jordan Jacobs,他是Radical Ventures的管理合伙人和联合创始人。他将为我们介绍今天的课程。欢迎Jordan!
Jordan Jacobs:非常感谢!感谢大家的参与。今年是我们举办Radical AI创始人大师班的第四年,社区规模已经接近2000人。看到这么多人参与这个项目,真是一次非凡的经历。今年我们很高兴能够像去年一样,以李飞飞的演讲来开启课程。
在介绍她之前,我先简要介绍一下Radical的背景。我们几位创始人早在2010年就创办了自己的AI公司。在2017年阅读了Transformer论文后,我们决定出售公司并专注于建立世界领先的AI投资机构,因为我们相信这种技术将被应用于或取代几乎所有软件系统,这将是一次工业革命级别的机会。此外,这项技术还将在生物、化学、物理等多个领域解锁此前无法实现的可能性。今天我们将讨论一些以前从未实现过的领域,这让我们非常激动。同时,我们也希望通过这次课程,帮助大家找到新的创业灵感或加入新的项目,并将创新想法转化为现实。如果有任何需要我们帮助的地方,请随时告诉我们。
接下来让我为大家介绍飞飞。李飞飞是斯坦福大学人类增强研究中心(HAI)的创始主任,同时也是美国国家工程院、国家医学院和美国艺术与科学学院的院士。她还是WorldLabs的联合创始人和CEO,这是一家空间智能公司,致力于构建可以感知、生成并与3D世界互动的大型世界模型,我们将深入探讨这个话题。WorldLabs上个月刚刚从隐身模式走出来,我们是其最早的投资者之一。这家公司非常具有前景,我相信它是当今世界上最令人兴奋的公司之一。飞飞不仅是Radical Ventures的科学合伙人,还是我们非常好的朋友。欢迎回到Radical AI创始人大师班,飞飞!
李飞飞:谢谢你,Jordan。也谢谢大家的欢迎,很高兴能再次回到这里。
Jordan:那么,让我们直接进入主题吧。你能为我们解释一下什么是空间智能(Spacial intelligence)吗?这也是WorldLabs的研究领域。
李飞飞:空间智能,与“看”、“理解”、“推理”以及“生成和创造3D世界”息息相关。这实际上是自然界为了所有移动的动物物种适应3D物理世界而发展出来的能力。想一想进化在智力上的能力。虽然语言是其中重要的一部分,人类无法在没有语言的情况下建立文明。实际上,我们在AI中也看到了语言的巨大进步。
但如果回顾进化历史,当人类语言出现时,最早的时间可能是100万到200万年前。而感知、理解和与物理世界互动的能力,可以追溯到5亿年前甚至更早。这种能力使得我们能够在3D世界中导航、移动物体、创造事物、社交、建立社区等。所以,空间智能是关于如何将3D世界的信息转化为理解、推理和互动,并超越对现有3D世界的映射,在心智中创造不同的可能性,从而设计出精美的雕塑、做出一份煎蛋卷,或规划整座城市。
Jordan:你是如何构建能够实现这种空间智能的AI系统的?
李飞飞:这个过程需要大量的努力。我把这称为“像素技术(pixel technology)”。如果你来自计算机视觉领域,你可能会反驳说像素是二维的,那应该称之为“体素”。从严格的角度来看,我同意“体素”是更准确的说法。但由于“像素”这个词更为流行,我用它来表达这种技术。这是语言技术的“姊妹”技术。我看到其中有许多相似之处,但也有超越语言的新创新。其中最重要的相似之处是,我们需要建立基础模型,以实现深度空间智能的能力。所谓基础模型,就是能够吸收大量数据的模型,具备在感知和空间智能领域处理多种相关任务的能力,同时也能根据不同输入进行生成。因此,我们的重点是为此开发基础模型。
Jordan:让我们稍微回顾一下。我们已经讨论了多年这个领域的机会,你在这个领域的研究也是世界领先的。那么,是什么促使你决定将这一研究商业化,并围绕这个领域建立公司呢?
李飞飞:对我来说,这感觉像是一个连贯的过程。我的整个职业生涯一直都在不同阶段思考这个问题。然而,在最近几年里,我与你以及其他朋友的交流中,越来越能感受到市场时机的成熟。与五年前相比,如今人们对AI的认知和需求显然更加成熟。这些新兴的行为模式包括将AI工具作为协作伙伴,比如copilot的角色,或者用来生成创意、提供陪伴。随着这些新的用户行为逐渐显现,可以越来越清楚地看到,在像素领域也需要类似的发展。与此同时,也能看到早期的迹象,比如人们对图像生成的热情,以及他们在尝试视频生成时的兴趣。虽然这些都属于二维像素(即使视频是二维加上时间的形式),但人们的需求已经开始转向希望能更深入地与像素互动,深入理解3D世界。这正是这个想法从单纯的学术思考转变为潜在商业机会的原因。
Jordan:这对观众来说是一个非常重要的提醒。大家在刚接触ChatGPT这样的AI工具时,会觉得它非常强大和独特。这不仅让我们重新思考行为模式,还创造了此前没有的新行为。特别是当我们与高中生甚至更年轻的孩子交流时,可以看到他们在过去不到两年里成为了“AI原住民”。所以,在创业时,时机并不是一切,但却是很重要的因素。这也为开发和推广新事物奠定了基础。你能解释一下这项技术能做什么吗?它与图像生成或视频生成有何不同?3D的元素又意味着什么?
李飞飞:这项技术能做的事情非常多。在我看来,它是AI拼图中一个非常互补的部分。语言技术擅长于沟通和推理,而空间智能则能帮助我们进行设计,辅助日常或专业活动,最终赋能于机器人等具象化的Agent。它的应用场景非常广泛。例如,在游戏、娱乐、创意、市场营销等领域,空间智能都有巨大潜力。许多人可能已经尝试过各种VR、AR设备,如Vision Pro或Meta的最新产品。这项技术将成为AR、VR和混合现实的感知层。
Jordan:那么,我们再往回看一下。当你决定创业时,最先需要的是一个想法。之后你会有产品、名字和logo,就像你今天穿的这件卫衣上的一样。但一旦你有了想法并决定去做,接下来最重要的就是找到合适的人。你成功吸引了一批非常优秀的联合创始人和其他团队成员。能不能谈谈你是如何挑选、找到并聚集这些人,与他们共同开启这个项目的?
李飞飞:这是个好问题。正如Jordan所说,我的三位联合创始人都是非常出色的人才。Justin Johnson是我之前的学生,曾在Meta担任研究科学家,也在密歇根大学任教。对于学习过CS231N深度学习计算机视觉导论课程的人来说,Justin、Andrej Karpathy和我共同开发了这门课程。当时Justin还是一名学生,他是个非常出色的研究员。
然后是Ben Mildenhall,他是NERF技术的联合发明人,这是一项近年来在3D计算机视觉领域的革命性技术。在共同创办WorldLabs之前,他曾是谷歌的研究员。还有Christoph Lassner,我多年来一直关注他的工作。他曾做过一项非常有影响力的研究POSAR,是在高斯斑点技术之前的先驱之作。他先是在Meta的Reality Lab工作,然后在Epic带领了一个非常有趣的实验室。
我们四个通过不同的方式联系在了一起:Justin和Christoph有合作,我和Justin合作过,而Ben是通过共同的同事认识的。我们发现大家的想法出奇地一致,但又各自以不同的方式为这个项目增添了一块拼图。于是,我们聚集在一起,同时也邀请了朋友、学生、学生的学生和同事,因为在这个领域里,我们知道谁是真正的顶尖人才。就这样,我们创办了公司。如果你访问我们的网站的团队页面,就会看到这些杰出团队成员的名字。
Jordan:找联合创始人有点像结婚,对吧?你实际上是在选择那些将陪伴你大部分清醒时间的人,至少每周五天,而作为创始人,这通常是七天,而且可能会持续五年、甚至十年以上,如果公司发展顺利的话。
在与不熟悉的新伙伴建立关系的过程中,你是如何做的?你和Justin已经很熟悉了,因为他是你的博士生,但你是后来才认识Christoph和Ben的。你是如何了解他们并决定与他们合作的?仅仅是通过相处吗?还是在初次见面时就意识到合适?我想每个人的经历可能都不同,但我很好奇你是如何做出决定的。
李飞飞:这是个很好的问题。另外,这里有很多不同背景的听众,而从初创企业联合创始人的角度来看,我其实是年纪较大的那一类。我常常开玩笑说,我是团队中最年长的,或许也是最“笨”的。
我觉得每个人都应该对自己保持真诚。许多年轻人也会向我请教经验,而我最真实的建议之一,也是我自己的实践,就是要保持真实性。无论你是否是领导者,保持真实性至关重要。尤其是在寻找联合创始人和初创团队时,就像结婚,但没有两年的恋爱期,或者六年的磨合期,所以最好的办法就是一开始就保持绝对的真实和坦诚,营造一种真诚和透明的氛围。如果在这种过程中发现不合适,那其实是好事,因为比起在后期出现问题,早期发现不合适要好得多。我相信,Jordan应该也有无数的例子可以告诉大家,联合创始人之间的问题是初创企业面临的最大问题之一。像我这种有些年纪的人,会很有意识地去面对这些问题。在我们公司成立的前三天,我甚至还特意创建了一个Google表单,上面写着一些“棘手问题”,要求我们四个创始人填写。这些问题非常尖锐,但它是我们进行透明、脆弱、真实交流的一个方式,让我们看看彼此是否能够在这样的氛围中合作。
Jordan:我很好奇,你们最近刚从隐身模式走出来,引起了不少轰动,因为你们所做的是一个巨大的机会,而且参与其中的人,尤其是你们自己,也非常具有吸引力。那么,到目前为止,最难的是什么?或者说,哪些是最难克服的挑战?构建技术,招聘顶尖人才,建立企业文化,与联合创始人建立关系,开放沟通,还是给厨房订购用品?
李飞飞:这是个好问题。首先,对于那些有志成为或已经是创业者的人来说,必须带着充分的心理准备去面对现实。真的很难。Jordan提到的每件事,包括给厨房订购用品,都是最难的,每件事都很难。招聘很难,规划很难,沟通也不容易。成为一个优秀的AI研究员或工程师是一回事,但要带领和管理团队则是另一回事。总之,一切都很难。
对于在场的观众和这个社区中的成员来说,我想强调的一点是,如果你是AI研究员或者技术背景出身的工程师或科学家,你的思维模式需要发生转变。你不仅需要关注技术,还需要关注客户的使用场景。即使是深度技术公司,我们目前也还没有产品。我们还在创造的过程中。但至少,你需要重新调整自己的思维,目标不只是下一篇NeurIPS论文,而是要在真实的人和客户的工作或生活中产生影响。我看到很多年轻创业者在这方面挣扎,或者需要培养这种心态。
Jordan:那你在这份工作中投入了多少时间?如果把一天或一周的时间划分一下,你有多少时间是用来与团队一起制定公司愿景、指导团队的?与此相比,你又有多少时间用于实际的科学研究工作?还有其他事情,比如管理投资者和融资,这些你在公司里已经做过几次了,以及所有其他非产品或技术构建的行政事务,这些都是CEO生活中的一部分。
李飞飞:如果你是CEO的话,这是最“分裂”的一份工作。所以对于那些想成为创始人的创业者来说,考虑一下你是否想成为CEO,或者是否可以找到一个朋友或伙伴担任CEO,因为通常来说,Jordan,你可能会同意,这是任何公司中最“分裂”的职位。我开始和你们谈话之前的15分钟前还在卸洗碗机。30分钟之后,我可能就在融资。这是一个动态的平衡。在融资季节,我可能会花90%的时间与投资者交流。在专注于规划和产品开发的季节,我可能会花更多时间与团队交流,从技术到产品开发。因此,这种平衡是非常动态的。
但在我的创业指导中,这也是年轻创业者面临的最大挑战之一,那就是如何确定优先级。你是如何知道需要做的所有这些事情的?即使是在联合创始人之间,我们也会进行每周的规划,并且确保我们对任务进行优先排序。我们有优先任务和次级任务,所有任务都很重要。多年前有人给我一个非常好的建议,我一直牢记在心中。一个2x2的矩阵,一条轴是重要和不重要,另一条轴是紧急和不紧急。我将任务分配到这四个象限中。最重要的象限显然是重要且紧急的象限。你会惊讶地发现,有多少人在不重要且不紧急的象限中做了太多的事情。你会很惊讶这是为什么,因为听起来没有人应该在不重要且不紧急的象限中做任何事,但我来告诉你。这些往往是一些零碎的小任务,它们带来了即时的成就感。当生活变得艰难时,当更大的任务难以突破时,做一些小事就像是“我完成了10件事”,但你需要小心这类任务。
剩下的两个象限是最难选择的,一个是“重要但不紧急”,另一个是“不重要但紧急”。人们通常会过度关注“不重要但紧急”的事情。虽然我不敢说自己是完美的,但我确实在锻炼自己的心态,尽量去完成“重要但不紧急”的任务。因为这些“重要但不紧急”的任务最终会变成“重要且紧急”的任务。当你承受过大压力时,有时无法交出A+级别的工作。所以,越多地提前处理重要但不紧急的任务,效果就越好。这四个象限帮助我在日常生活中实现动态平衡。对于像我和Jordan一样的人来说,我们不仅仅有工作。我们还面临着复杂的“夹心一代”生活。这让我更需要确保我处理好这些任务象限。
Jordan:对于在座的创业者来说,这些建议无疑是非常有价值的。能够用一个矩阵来框架这些日常任务,并且能够应用到日常、每周甚至每月的任务中,这确实是非常宝贵的建议。所以我建议大家把李飞飞刚刚分享的内容记下来,写在纸上,并开始应用到自己的日常任务中。这种方法真的能带来巨大的改变。而且你可能在职业生涯的十年里都未曾将这些任务如此清晰地归纳过。如果你在2024年剩下的时间里忘记了其他的事情,但如果你是一名创始人,十年后你会回想起这一点,会意识到这是一个宝贵且无价的建议。
李飞飞:我告诉你一个有趣的事情。昨天我和一位工程师在旧金山街头进行了一次“走路会议”,他刚好问了我这个问题。旧金山有很多大块的方砖人行道,我们恰好在一个路边站着。于是我们就指着人行道上的方砖,说这就是一个“2x2矩阵”。所以,如果你在类似的人行道上走着,或许这会提醒你使用这个方法。
Jordan:有时候这些看似简单甚至显而易见的工具,在经营公司时却是最重要的。正如飞飞所说的,你不断地在“转盘”,或者在“洗碗”,你一直在做各种事情。而如何优先处理需要完成的任务,不仅关乎你自己的理智,还关乎公司以最优方式运作的效率。因为其他人都在等待你做出决定、分配任务或承担任务。如果你用同样的方式对待每一项任务,那实际上会损害公司运作的效率。所以,像你描述的那种优先级的处理方式实际上是一个出色的矩阵。
李飞飞:有人在聊天中说这叫“艾森豪威尔矩阵(Eisenhower matrix)”。谢谢,我还不知道。
Jordan:这就是群体智慧的体现。回到大世界模型的话题上来。基础模型通常需要两件非常重要且具差异性的东西。一般来说,这两个方面的需求总是超过供给。一个是计算能力,另一个是数据。你能谈谈World Labs在探索空间智能时的需求吗?相对而言,你们需要多少计算能力?你不必给出具体的数据,但是否与我们在OpenAI所见的规模类似?是像小型语言模型那样吗?还是完全不同的?其次,数据方面,什么样的数据有助于构建这些模型?
李飞飞:简短的答案是:是的。AI既需要大量的数据,也需要大量的计算资源。无论你是否真正相信“规模法则”,数据和计算能力之间大致存在正相关关系。所以,作为创业者,如果你有想法,首先要问自己关于数据的问题。要从数据开始。算法往往是可商品化的,每个人的算法风格略有不同,但它们大多可以完成类似的任务。但真正要理解的是你的数据来源、如何创建数据飞轮、数据护城河在哪里。我的整个职业生涯都是由数据所定义的。我很幸运,可能是AI领域中最早意识到数据重要性的人之一。
然后是计算能力,这直接关系到你的资源配置。与投资者(例如Radical及其他投资者)深入探讨这些问题,了解你需要多少计算资源,这对你的预算和筹资有什么影响。计算是一个非常动态的项目,成本可能非常高昂。同时,在计算人才方面要非常精明。找到能够优化训练或推理过程的人才对你来说非常宝贵,尤其是在计算密集型的情况下。所以,我可能是在重复你已经听过多次的内容,但这些确实是智慧的结晶。这两点都非常重要。
Jordan:那么数据确实是一个区别因素。假设每个人都能获得所需的计算资源,那么数据才是真正的区别所在。正如你提到的,你可能是第一个甚至唯一一个将数据视为AI系统获得最佳输出的关键输入的人。回想起你为ImageNet创建了1500万标注数据集的过程,这也引发了2012年由Geoffrey Hinton、Ilya和Alex带来的突破成果。Geoff最近获得了诺贝尔奖,但直到2012年,人们才开始真正理解神经网络的价值,而这一切都是因为你创建的数据集。你对数据的长期思考是否为这家公司带来了优势?
李飞飞:我愿意这么认为。我想,作为我的投资者你可能也会这么认为。
Jordan:我当然是这么认为的。
李飞飞:是的,实际上昨天我正好在审查我们的数据策略,并与团队中的一位成员讨论了一些战略选择。我意识到,对数据的深刻理解确实帮助我作为一个领导者更好地确定优先级。这一点非常重要。
Jordan:那么,World Labs的产品会是什么样子呢?是一个平台吗,还是一个垂直应用?给我们一个概念,不需要具体细节,因为我知道这可能涉及一些机密,但能不能给我们一些预期的概念?
李飞飞:部分的秘密在于我们还在探索中。这是一个非常深奥的技术,正如生成式AI所展示的,至少对我们这样的公司来说是如此。其中很大一部分实际上会由模型的能力所驱动。这也是我不能透露太多的原因。目前可以说我们把自己定位为横向发展,而不是专注于某个特定的垂直行业。但最终,我们还是需要在最初的迭代中缩小到具体的用例。这是我们必须经历的一个过程。
Jordan:那么,对于在场的开发人员和研究人员来说,他们是否能够在未来某个时间点上获得这一产品的使用权并自行测试?或者这将是针对企业客户或消费者的产品?你有什么可以分享的想法吗?
李飞飞:目前我的答案是希望如此。
Jordan:好的,我们暂且接受这个回答。可以告诉我们World Labs接下来会有哪些新动态吗。显然,你们正在同时推进所有这些事情。当前的优先事项是什么?是产品和技术的开发吗?是团队的进一步扩展吗?你们在短时间内已经进行了两轮融资,这真的很了不起。未来的6到12个月里,你还需要做些什么?
李飞飞:我想要继续“建设”。我们正在集中精力建设:建设团队、建设技术、建设产品。坦率地说,这才是创业最有趣的部分,因为你在创造这些东西。我记得在公司的一次外部活动中,我和公司里的企业家们分享过,人类是通过建设文明来推动进步的。我相信技术的发展推动了文明的前进。当然,我们也要谨记技术的双刃剑效应。我们始终需要负责任地发展技术。但总的来说,我相信科学和技术帮助人类建设文明,而我热爱这种建设的过程。
Jordan:让我问你一个有点不同的问题:公司的文化有多重要?建立这种文化有多重要?它对公司运营的速度和效率有多大贡献?
李飞飞:这是一个很好的问题。对于年轻的创业者来说,他们中的一些人可能在某些方面甚至比我更有经验。文化就是一个非常好的例子,它非常重要,但表面上看起来并不紧迫。总是有事情要处理,总是有代码出错,总是有其他问题要解决。但在我看来,文化是最重要的事情。尤其是当你在创立公司或共同创立公司时,你必须对文化有非常明确的意图。因此,文化的重要性已经无须赘述了。
从第一天起,我和我的团队一起工作时,就讨论了文化:核心价值、核心目的和核心文化。但我也意识到团队比较年轻,大家还在彼此了解中,所以我们在几个月后专门安排了一次外出活动,来回顾、更新我们的文化,并创建一个更加稳固的“文化章法”。
最近我在公司分享了一个例子。我展示了一张幻灯片,这张幻灯片上的数据其实没有直接说明什么,我是在考问他们。它展示了Nvidia股票的走势图,几年来相对平稳,然后突然大幅上涨。我问他们这是哪家公司的股票,很多人猜到了,因为这是一条非常戏剧化的曲线,他们说是Nvidia。我在图表上突出显示了Nvidia股票剧烈上涨的部分,并告诉大家要关注这点,Nvidia现在是全球的领头羊,他们当之无愧。
但接着,我重新强调了那些长期平稳的时期。当时,人们都在chew glasses,生活艰难,团队有人离职、事情进展不顺利、市场没有认可他们的价值。是什么让这样一家规模的公司在这么长时间里保持稳定?答案就是文化、核心价值、核心目的和黄仁勋及其同事们开发的核心文化。这些文化使得员工可以在多年的低谷期中保持信念。这就是你们作为创始人应该关注的,建立那种文化基础,以便你和你的团队能够应对任何起伏。所以我再怎么强调文化的价值都不为过。
Jordan:让我们再深入一点,你说文化必须是“有意为之”的,是否意味着作为创始团队要聚在一起,写下构建公司和运营方式的基本原则?为达到这种意图性并能够与即将加入组织的人分享,又需要做多大的工作?
李飞飞:是的,其实每个人的方式都不同,这取决于真实性。我相信每个人都有不同的(生活或工作)方式。你首先要做到的就是要真实地去体现这种文化。但就我们来说,确实是那样做的。字面上在公司成立的第一周我就写下了我们文化的第一个版本,然后我们进行了讨论。几个月后,我们把所有人聚集到一起。因为那时我们还处在早期阶段,创始团队人数不到20人。我们真的坐在一起讨论了几天,每一项文化都逐条讨论,我们删掉了一些,添加了一些,然后我们必须承诺这是我们所相信的文化清单。
从那时起,特别是作为CEO或联合创始人,你必须不断提及文化。我自己会有一些小的做法,比如我会在某个文化的后面加上标签。比如,如果某项文化是“真实性”,我就会在我的演讲、文件或文档中加上“真实性”的标签,并谈论它、实践它。
文化非常重要,尤其是当你在想为什么我们需要文化时,大家都谈论文化是要友善、尊重彼此。没有人会在文化中写上“我要做个混蛋”或“我们要彼此刻薄”。那么我们为什么还需要文化?文化在你产生分歧、激烈辩论、醒来时感到无动力,或者失去目标时非常重要。这些是文化派上用场的艰难时刻。你可以几乎是字面意义上在当下召唤出某种文化,它会帮助你解决问题。我对此非常有意为之,我们的创始团队也是如此,我相信这种纪律性和实践性。
Jordan:我完全同意你的看法。我们投资、合作的每家公司,包括在我们自己公司成为投资者之前,促使公司成功的关键就是文化。文化这个词经常被提到,如果你没有待过一个文化糟糕的公司,你可能真的不知道文化意味着什么。而如果你没有待过一个文化很好的公司,你也不一定真正知道文化的含义。文化可能只是潜藏在背景中,但当你遇到一个拥有优秀文化的公司时,你能感受到它。历史上有很多广为人知的例子,那些以优秀文化著称的公司往往表现得最好,员工保留率远远高于其他公司。
如果你把它归结为利润和成功,历史上有很多关于强大文化如何使这些公司成为世界上最成功的例子。所以我完全同意你的观点,我们可以在开放提问前多聊聊这个话题。因为Roll Labs还很年轻,我想它还不到一年的时间。我们大约已经有九个月、十个月了,还是一个非常年轻的公司。
这并不是你第一次创立公司。你之前建立了实验室,创办了非营利组织,也建立了Hai,参与了其他初创企业,你在很多方面都有过经验。对于Roll Labs,从创立到现在,让你感到最意外的是什么?或者说到目前为止,最让你感到满足的事情是什么?可能最意外的是你需要经历的各种麻烦,甚至是为了决定厨房里该点什么而需要达成共识的那种折磨。
李飞飞:让我感到惊讶的事情是什么?比起内部的事情,更让我惊讶的是宏观层面的速度。作为一名AI内部人士,我依然感到惊讶。全世界真的觉醒了,意识到了AI的重要性。你和我之前也讨论过这个问题,宏观环境依然是持续带来惊喜。并不是说我对此完全没有预料,因为我是AI技术专家,但依然会让我感到震撼,这种进步的速度令人惊讶。
而对我来说,最有回报的事情,可能对年轻的创业者不太适用,那就是谦逊。因为对我这样年纪的人来说,认识到自己不知道的事情、自己不擅长的领域以及新的东西是非常重要的。成为一名CEO、成为一名企业家是极其谦卑的经历。无论你拥有什么,无论你有怎样的名声,无论你在人生中取得了什么成就,甚至无论投资者在融资过程中对你说了什么,因为投资者在你融资时会不断夸你,甚至让你觉得自己是“天选之子”,这些都不要太在意。
保持谦逊,知道学习是多么艰难,学习的回报是多么巨大。当你保持谦逊时,你会有一个开放的心态。我觉得自己每小时都在学到新的东西,这就是最有回报的地方。
Jordan:这对在座的各位来说,真是非常好的建议和见解。
李飞飞:抱歉,我才刚说过不要听投资者的话。
Jordan:你知道,我要稍微夸赞一下。我作为创始人,确实觉得每天、每小时都在被教做一个谦卑的人。如果你不是一个好奇、想要学习的人,这可能就不是适合你的工作。但如果你愿意这样做,并且能够放下自我,那这真是一次难以置信的经历。如果你不愿意放下自我,生活会让你被迫放下,因为你会经历很多起伏。在早上10点,你可能会经历世界上最伟大的事情,而在下午4点,你可能会面临最糟糕的事情。这种情况可能每天都会发生,可能会持续好几年。你必须学会在过山车的两端都能应对,既要享受爬到顶端时的兴奋,也要忍受翻转时的恶心感。
李飞飞:尤其是对于首席执行官来说,那些想要成为CEO的人,真的要把自我意识留在家里。因为我无法告诉你我有多少次道歉。我无法告诉你我有多少次在电子邮件、Slack、或当面说过:“这是我的错。”我为没有做好这件事承担责任。我无法告诉你我有多少次去找比我年轻得多的人说:“我不知道该怎么做,请教教我。”你真的必须放下自我意识。
Jordan:非常正确。现在我们来开放提问。我们在聊天中收到了很多问题。Leah,你想让我挑选一些问题并读出来吗?
Leah:我有几个问题已经被一些朋友提到顶部。也许我可以先问这些,然后我们可以再讨论其他问题。刚才你提到的主题是Yasmin问的,关于这个会议的主题是:“我怎么知道自己是否适合创始人所面临的艰难困境?”因此,进一步延伸你刚才提到的想法。
李飞飞:这是个非常好的问题。我不知道我是否有一个具有魔力的答案,因为你的生活经历将你带到了这一点。也许你需要一些自我反思,真的要认识到你内心是否有这种能力。你过去是否做过一些事情,表明你能够经历任何艰难困境,以实现你的目标?坦率地说,无论是我作为教授或顾问的身份,还是Jordan作为投资者的身份,我们所寻找的正是这种品质。
Leah:说的太对了。接下来,我想问来自Hamanchu的问题,他作为一名观察者加入我们,他是我们之前的一个小组成员。这是一个更偏向研究的问题,我很想听听你对下一代架构的看法。是什么将推动深度学习超越Transformer?这有点推测性。
李飞飞:老实说,如果我有明确的想法,我现在也不会告诉你。,举个例子,我对这些Transformer的主要思想感到非常沮丧,因为它们大多是基于对标记的编码或嵌入。最开始是词汇标记,现在我们在对图像补丁进行标记。坦率地说,这整个想法并没有真正尊重世界的结构。因为,当你对一个补丁进行标记时,你已经将世界压平了。因此,当然你可以讨论那些或是FOXO标记化,但这仍然不一定是表达三维结构的内在方式。所以,在这方面可能还有很多工作要做。这只是代表性的一方面。可能还有其他方法可以推动学习的进展,以及长期上下文等等。所以我现在没有一个快速的答案。
Jordan:我在聊天中看到一个问题,关于机会成本的问题,不仅是你花时间做其他事情的机会成本,还有你选择创业而不是在大公司或其他工作中获得的薪水。你是怎么考虑这个问题的?你是如何做出这个决定的?对于处于职业早期阶段的人有什么建议?好的我会对这些问题给出我的看法。
这个机会成本的问题从来不会变得简单。你年龄越大,离开薪水的难度就越大,因为你往往有更多的责任,无论是房子、抵押贷款、家庭或其他依赖。因此,你能冒险的越早越好。随着年龄的增长,冒险变得不会更容易。通常的意思是“不是对每个人都会生效,但大多数情况下如此”。Fei,或许你想补充一下,因为你不仅在World Labs内部做着所有的事情,还在斯坦福大学忙着,同时还是母亲和你自己家庭中的照顾者,你承担了很多。你是如何平衡这一切的?
李飞飞:我总是说有两种平衡。一种是静态平衡,一种是动态平衡。这就像骑自行车一样,你在静止状态下是无法平衡的,但在运动中可以平衡。因此,我感觉我一直能够做到动态平衡,而不是静态平衡。
至于如何做决定,每个人都不同。有些人非常善于分析,他们会列出优缺点等等。就我个人而言,我决策越大,我越不倾向于走分析路线。因为在做算法时,我会完全分析;在决定预算时,我也会完全分析。但在决定是做这个项目、结婚还是创业时,我不知道我如何能过于分析。你必须深入内心,相信自己。真实地对待自己,相信你是否会在三年后醒来,后悔没有采取那一步。我会非常后悔,以至于此刻你不能不去做。如果答案是这样,那就去做吧。如果你真的在考虑三年内财务的精确平衡,甚至计算到小数点,这不适合你。我觉得,创业不会保证那些。
Jordan:我会分享一个我自己使用的小方法。这并不一定适合所有人,但我会试着把自己放在85岁的角度,和自己进行一次诚实的对话。现在世界可能会变化,但假设我到了85岁时,不再全职工作。也许我们都能活到150岁,这样这实际上只是中年。
李飞飞:你可以竞选总统,Jordan。
Jordan:是的,没错。虽然我不能,因为我是加拿大人。但除此之外,我的确可以在年龄上处于适合竞选总统的黄金时期。好吧,假设我不竞选总统,也不激进。到那个时候,其他人会接管。但我正在与自己进行一次关于两件事的诚实对话。第一,我最开心、最满足于自己一生中完成的是什么?这就像是在反思过去。可以是各种各样的事情。可以是我在一个协作的工作中工作,我们共同创造了东西。可以是我养育了优秀的孩子,可以是我有机会旅行,看到世界。对一些人来说,可以是我赚了最多的钱,买了一个私人岛屿,还有四架飞机来回接送我。因此,你必须非常诚实地对待自己,明确这些事情是什么。
另一个是你刚才提到的:我后悔什么?我希望做但没有做到什么?后悔是一个非常强大的工具,可以让你专注于最重要的事情。因为如果你可以展望未来,思考哪些决策会带来后悔,有些人可以忍受很多后悔,而大多数人不能。这种感觉真的会折磨你,尤其是如果是一个重大后悔。因此,如果你能有这两个框架,并且能尽可能把它们推向未来,你就可以开始从那里倒推,开始说,好的,在我生活的这个阶段,我会做A,在这个阶段,我会做B。然后你可以一直推到你今天所在的地方。这样你就不会觉得必须在第一天完成所有事情,打勾每一项,你可以开始做出合理的决定,思考接下来的10年,以及接下来的10年或15年,甚至之后的10年或15年。
当然,会有各种各样的事情会干扰你,改变你的方向,而这些都是你无法预料的。有人可能会说,我永远不想结婚,但八年或十二年后突然间,你遇到了一个让你心动的人,你的整个视角就会改变。所以你必须对这一切保持开放的态度。但,如果你能诚实地思考在你充实的职业生涯结束时你对自己所做的事情的感受,以及你会后悔没有做的事情,这可以帮助你开始考虑在职业早期冒险的决策。对我而言,这个方法有效,但对其他人可能不适用。
这就是我使用的一个小建议,它一直是一个很好的指南。还有一些其他问题,Leah,你想挑选几个问题吗?
Leah:好的,另一个研究导向的问题,Matt问:我想知道你对当前视觉基础模型的看法。例如Sora、Dino V2、MovieGen,这些现有模型的优势是什么?你认为这个领域目前缺少什么?
李飞飞:就像我之前说的,这些当前的视觉基础模型主要集中在二维,当然还有二维加时间。这个领域缺少的是空间智能。
Leah:明白。Kevin说:感谢分享你的经验。你对目前AI的使用案例有什么看法?Jordan,你在大型语言模型(LLM)和生成式AI的繁荣中也看到了很多这方面的内容。
有很多使用案例,特别是在娱乐方面,Kevin提到并讨论了这一点。你对这些娱乐使用案例和可能从根本上改变我们生活、工作和娱乐方式的事物有何看法?我想这一点非常重要,也许假设我们玩乐的方式不会在结构上影响我们看待世界的方式,可能有点过于主观。但考虑娱乐与自动化危险的体力劳动之间的区别。
李飞飞:那么,问题到底是什么呢?因为我相信这两方面都有责任。
Leah:我们可以集中讨论一下AI目前被使用的案例。你对此有什么看法?
李飞飞:好的,首先,AI是一个非常大的术语。所以,如果你和OpenAI的人或其他话题交流,会听到很多语言使用。不过对我来说,我会更专注于像素世界来缩小范围。我们听到很多关于电影、创作者和娱乐的讨论。但我确实觉得扩大我们的视野是很重要的,因为有很多使用案例。虽然这些可能不是短期的,但它们非常重要。例如,在医疗保健方面,空间智能有无尽的使用案例,无论是引导手术,使其更精确、高效和安全,还是在居家老年护理中,使用AI或空间智能进行步态检测、行为变化检测等,这些都是可能的。
再比如制造业,在制造业中,AI可以深度协作,特别是一些制造过程是如此重复,而如果做得如此精确,其实并不自然适合人类去完成,AI可以发挥巨大的作用。我知道这不是一个大市场,所以可能不是市场驱动的,但在一些危机情况下,AI的作用是深具人道主义精神的,比如灾后救援等。空间智能在这方面有巨大的潜力。部分案例需要具象化,这就涉及到机器人;部分案例可以通过增强现实或虚拟现实进行引导,例如手术场景或家庭中的智能传感器。因此,使用案例相当丰富。
还有一个案例,虽然可能没有那么引人注目,但却非常实用,那就是许多服务。很多基础设施服务,不是指机器学习基础设施,而是电网、家里的破损加热器等,很多这类基础服务现在需要人力,但我们面临人力资源短缺的问题,因此将AI作为人类的协作工具是非常重要的。即使是一些不是新鲜的、没有那么吸引眼球的使用案例,也可以大量利用AI。
Leah:未来我们将更专注于产品开发,但我很想听听你对如何构建首个产品MVP的一些看法。当你在做出可能困难的决定时,关于将什么纳入产品以解决特定问题,你是如何考虑产品开发的?
李飞飞:Leah你说得对,我相信Radical将有更多的资源来进行产品诊所和教程。此外,我想说的是保持真实。我并不认为World Labs已经取得了成功。让我来明确一点:我们有很大的潜力,拥有出色的团队和愿景。但我不能在这里告诉你我们已经完成了OpenAI或其他伟大公司的成就,我们与大家在同一旅程上。在产品方面我们正处于这一过程中,但根据我自己在其他产品开发中的经验,有两件事对我来说特别重要。首先,尤其是在从0到1的产品开发中,“好奇心”至关重要。要真正保持开放的心态和好奇心,倾听用户和客户,了解这项技术是什么。如果你是开发这项技术的创始人,那么你可能对一切都很了解。但如果你在技术与客户之间,需要对双方都保持好奇心。因此,好奇心真的很重要。其次,“客户关注”也非常重要。这是研究人员和工程师转变为企业家和产品思考者的一个过程。
Jordan:我想问一个我在聊天中没见到的问题,尤其是在最近的AI领域,如果你看看博士项目、创始人群体,甚至创始人获得的资金,从性别角度看,情况一直很不平衡。作为一名女性,不仅是创始人还是首席执行官,在一个男性主导的AI世界中,你的经历是怎样的?你是否感受到作为女性在这个领域和作为领导者的不同,这有什么优势?也许对于那些考虑创业的女性来说,应该思考什么?
李飞飞:这是个非常好的问题。Andrew Dai,我很感谢你提问,特别是我看到这里有多样化的观众。我相信这是一些人心中的疑问。我们所有人都必须平衡一个张力,即作为个体的自我与我们所生活的社会的更大背景。因此,老实说,我在日常生活中并不总是考虑到自己在更大类别中的身份,无论是作为女性、亚洲人还是其他身份。
所以我尽量做真实的自己。我以真实的态度对待我的团队,无论他们来自哪里。这样的结果是,我也可能以一种我希望人们不会仅仅把我框定在那些标签中的方式来展示自己。因为他们必须看到一个真实的Fei-Fei,而这个真实的Fei-Fei是非常细致入微的。那些他们可以给我的标签,因为标签在描述一个人时是非常模糊的。
与此同时,作为在AI领域较为资深的女性,我清楚意识到我们年轻的企业家和来自非传统背景的技术人员所面临的挑战。确实存在一种真正的挣扎,真正的挑战,以及来自硅谷和整个世界的无感,这让我感到困扰。我们曾经讨论过,这种困扰并不是说Fei-Fei受到不公对待,而是这种不平衡依然存在。而且让我感到困扰的是,我们年轻一代的处境并没有比我的一代人好多少。在我看来,那个变化并没有朝着更好的方向移动。因此,我觉得作为AI领域的一位女性领导者,这让我有责任公开谈论这个问题。不是为了为自己辩护,而是为了那些没有被倾听和关注的声音辩护。这是一个深刻的问题。
我可以告诉你一个让我非常愤怒的例子:2023年12月,《纽约时报》发布了一个“顶尖10位”或“顶尖12位”的AI领导者名单,我不太记得具体数字,反正整个名单都是男性。我在推特上发了推文,表示这是不对的。我不在乎借口,因为我知道《纽约时报》说,“哦,编辑是这么做的,或者出版商这么做了。哦,我们没有规则允许我们更改。”这种情况显然是错的,特别是如果你看看那个名单,其中一些人真的并不属于AI领域。因此,我们必须指出这一点。我觉得很有必要指出这一点,因为我确实在为一些没有被听到的声音发声。
Jordan:而你确实做到了这一点,所以我不想占用我们剩余时间的所有部分,但我想问你关于“AI for All”的事情,因为为了尝试解决这个问题,你创立了一个组织。你能简要告诉我们一下吗?因为这是一件了不起的事情,而足够多的人还不知道它。
李飞飞:AI for All(AFO)是一个非营利组织,成立于2017年。实际上,它的前身可以追溯到2015年,我们在大学校园创建了夏季项目,邀请年轻人来学习AI,特别是高中生。我们关注的是代表性不足的群体,比如年轻女性、来自农村地区和内城的年轻人,以及不同种族背景的人。当然,它还扩展了几个其他项目,包括实习和大学路径等。但AI for All的基本使命是培养未来的领导者,使他们在AI领域的多样性大于今天。我们的口号是:“AI正在改变世界,谁在改变AI?”我希望看到更多多样化的领导者来改变AI。
Jordan:而这种多样性的真正好处在于,你能够获得更多不同方向的思维和更好的创意,因为有来自不同背景的人参与。我用这个例子,在我们的第一家公司,前12个人来自12个不同国家。在我们的第二家公司,也是位于多伦多,我想我们可以有一些其他国家的人们,我在加拿大出生,接下来69个人都是出生在加拿大以外。所以在公司中有70个人,只有一个是在国内出生,但我一直觉得这给我们提供了一个非凡的价值主张和优势,因为那些人带来了不同的思维方式和不同的方法。而且坦白说,当我们在构建产品时,我们也在考虑为全球构建,而不仅仅是为我们的本地地区或我们所认识的人构建。
我知道这是你在World DOC中分享的一个想法,它同样是非常多样化的思维者,来自不同背景的人。我是说,他们都非常聪明。你有什么建议要给那些在这里思考要出去创办某个东西、加入某个年轻公司,或是将一个想法变成公司的人的人呢?
李飞飞:创办或加入一家公司与在生活中寻找自己的旅程没有太大区别。这可能是一个重大的事件,但即使在生活中,你仍然必须做真实的自己。
我一年前写了一本书,名为《我所看到的世界》。在那本书中,我描述了作为一名年轻的AI科学家,与我的领域一同成长的旅程。这本书的主题是找到你的北极星,勇敢地去追寻它。这确实适用于创业。
无论你是加入一个初创公司还是创办一个项目,从定义上讲,你都必须看到那个北极星。你必须在其他人之前看到它,必须逆境而行,并保持真实。那个北极星是你绝对想要尽全力追寻的目标,这样当你85岁的时候,无论你是否达到了那个目标,你都不会后悔在你生命的这个时刻找到了那个北极星,并全心全意地尝试过。这实际上是万事的起点。这也是我会建议年轻人引导自己生活的方式,就是找到并追逐你的北极星。
Jordan:在此,我们应该差不多结束了。首先,对于那些还没有读过《我所看到的世界》的朋友来说,这真是一本令人难以置信的书。它是一段非常鼓舞人心的旅程,让我们理解李飞飞的生活、她的出身以及她是如何走到今天的。大家都可以从中获得很多灵感。它也反映了人工智能的崛起,因此从某种意义上来说,它为我们提供了李飞飞人生视角下的AI。这就是为什么我在有人问我关于AI应该读什么书时,我总是推荐这本书。所以对于所有还没有读过的朋友来说,这并不是一本深奥的技术读物,但确实是一本非常引人入胜的书。
非常感谢你,你的建议总是很棒,这对许多在座的社区成员(大多数是学者、研究人员或工程师)来说,都非常有价值,他们正在考虑成为企业家的前景,而你已经走过了这条道路。因此,你的经历很重要,同时又以一种易于理解的方式人性化了这个过程。非常感谢你抽出时间。我知道你的时间很宝贵,还有很多其他事情要做,比如从World Labs的洗碗机中卸载盘子等更重要的事情。
李飞飞:祝大家好运,谢谢。
原文:Session 1: RadicalAIFounders Masterclass – 李飞飞
https://www.youtube.com/watch?v=lP1b2j0k8z8
编译:Grace Bo, Jie Sun
文章来自于“Z Potentials”,作者“Radical Ventures”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md