a16z创始人对谈AGI创业：AI能力存在上限、不要笃信「数据是石油」、AI泡沫肯定会发生

10272点击 2024-05-21 09:48

A16z（Andreessen Horowitz）可能是最会做内容的投资公司。他们在官网上发表的很多 AI 时代的创业思考和观察，都是很值得阅读的好文章。

最近，a16z 在 Youtube 上发布了联合创始人马克·安德森（Marc Andreessen）和本·霍洛维茨（Ben Horowitz）的对谈视频，视频中，安德森与霍洛维茨探讨了面对拥有了算力和数据规模优势的大型科技公司，小型人工智能初创公司如何与之竞争；揭示了数据作为可出售资产被高估的原因；以及人工智能热潮与本世纪初互联网浪潮的异同之处。

尤其是对于「数据是石油」的观点进行了强有力的反驳，在两位创始人看来，核心是如何使用数据，而不是贩卖这些数据。

文章转载自「腾讯科技」的编译，Founder Park 略有调整。

a16z创始人对谈AGI创业：AI能力存在上限、不要笃信「数据是石油」、AI泡沫肯定会发生

划重点

面对大型科技公司的算力和数据优势，小型 AI 初创公司需要专注于构建与大公司不同的、具有独特价值的产品和服务。

当用来自互联网的数据训练一个语言模型时，互联网数据集的本质是什么？它实际上是一切的平均水平，它是人类活动的一种代表。

数据作为可出售资产常被高估，真正的价值在于如何利用数据，而非数据本身。

技术进步和市场反应存在不确定性，风险投资模型接受一定比例的失败作为创新过程的一部分。

历史上的重大技术进步往往伴随着金融泡沫，这是新技术推广的自然组成部分。

如果一个社会对新技术的出现没有投机行为，那将意味着这个社会基本上对新技术的前景以及创业精神持有一种根深蒂固的悲观态度。

巨头阴影下的机会：

AI 初创公司的生存之道

安德森：首先的三个问题都聚焦于同一主题：

一是人工智能初创公司如何与大公司竞争。面对即将到来的人工智能时代，初创公司的创始人们目前应该专注于构建什么？

二是小型人工智能初创公司如何与拥有巨大算力和数据规模优势的老牌科技企业竞争？

三是对于依赖 OpenAI 等公司的技术的初创公司，哪些公司能够从基础模型未来的指数级改进中受益，哪些公司又可能因此而失败？

先从第一个问题开始，然后再深入讨论。OpenAI 首席执行官山姆·奥特曼（Sam Altman）最近在一次采访中提出了一些我本人非常认同的观点。他的观点大致是，作为初创公司的创始人，应当预料到大型人工智能公司推出的基础模型会大幅改进，并应就此提前制定出应对策略。如果当前的基础模型性能提升 100 倍，初创公司的创始人们会有什么反应？他们应当对此感到兴奋，因为这对自己的公司构成利好；还是应当感到担忧，因为这可能会带来一系列的问题？你对此有何看法？

霍洛维茨：我基本认同奥特曼的这个观点，但也有一些细节需要注意。从他的角度来看，他可能在劝阻人们不要自己构建基础模型，我并不完全同意这一点。许多正在构建基础模型的初创公司实际上做得非常好。

出现这种情况的原因有很多，首先是模型架构的差异，这决定了模型的智能程度、响应速度以及在特定领域的性能。这不仅适用于文本模型，也适用于图像模型。不同类型的图像对提示词的反应各不相同。例如，如果你向两款模型提出相同的问题，它们会根据用例以非常不同的方式作出反应。

其次，模型蒸馏（distillation，能够把大模型的知识迁移到更小、更高效的模型中，在保持性能的同时降低算力和内存需求）技术的出现。OpenAI 可以开发全球最大、最智能的模型，初创公司则可以推出蒸馏版本的模型，用更低的成本实现非常高的智能。鉴于此，尽管大公司的模型无疑会变得更好，但如果初创公司构建的模型在某些方面有所不同，或者专注于不同的领域，那么即使大公司的模型越来越出色，也不一定会影响这些初创公司。

如果初创公司选择正面硬刚大型科技公司，可能会遇到真正的问题，因为后者储备着巨额的现金流。但如果初创公司从事的工作足够独特，或者专注于不同的领域，情况则会完全不同。

举例来说，日前推出开源模型 DBRX 的初创公司 Databricks，尽管这家公司也开发了一款基础模型，但它采用非常特定的方式把这款基础模型与自己领先的数据平台结合在一起使用。即便是 OpenAI 的模型变得更好，也不足以对专注于特定领域的人工智能模型构成真正的威胁。

人工智能语音克隆初创公司 ElevenLabs 的语音模型已经嵌入到每个人的人工智能堆栈中。所有人都把该公司的语音模型作为人工智能堆栈的一部分使用。还有，ElevenLabs 的语音模型拥有开发者接口。这家初创公司专注于自己从事的事情。尽管一些初创公司表面上看起来是在与 OpenAI、谷歌或微软竞争，但实际上并没有真正的竞争，我认为此类公司前景广阔。

AI 智能存在极限值，

数据质量至关重要

安德森：你认为大模型，即所谓的「上帝模型（God models）」，真的会变得更好 100 倍吗？

霍洛维茨：我倾向于认为，大语言模型的性能确实有可能提升 100 倍。以我们目前对大语言模型的了解，尽管它们已经非常先进，但真正的区别可能只有深入研究它们的专业人士才能察觉。如果我们谈论的是性能提升 100 倍，那么按理说，我们应当能够看到某些模型在性能上与其他模型明显拉开差距。

不过对在日常生活中使用（如提问和获取信息）大语言模型的普通用户而言，这种提升可能不会那么明显。

安德森：我们期望的提升可能包括知识的广度和能力的提高。我认为在某些方面，如模型对于不同问题的响应速度和知识面，确实有可能实现显著的进步。此外，输出的精细度和质量也将是提升的关键。这包括减少错误信息，即减少「幻觉」，以及确保回答具有事实依据。

霍洛维茨：我赞同这些方面的表现将会大幅提升的观点，因为人工智能技术正朝着这个方向迅速发展。目前，我们面临的挑战是模型的对齐问题，即模型虽然越来越智能，但它们并不总是能够准确表达所知信息。这种对齐问题在某种程度上也限制了模型的智能表现。

另一个问题是，我们是否需要一个突破性的进展，从而从当前的人工智能——我称之为「人工人类智能」（artificial human intelligence）——过渡到更高级的「通用人工智能」（artificial general intelligence）。所谓「人工人类智能，」指的是人工智能在模仿人类认知和语言使用方面已经达到了令人惊叹的水平，它能够执行许多人类能够完成的任务。但如果要达到更广泛的智能水平，我们可能需要某种形式的技术突破。

如果我们目前的技术已经接近极限，那么在某些方面它可能不会实现 100 倍的提升。因为与人类相比，它们已经相当不错了。尽管如此，人工智能在知识掌握、减少幻觉以及在多个维度上的表现上，仍有望实现巨大的飞跃。

安德森：业界流传着一张图表，我记不太清它的具体坐标轴，但它大致展示了不同人工智能模型性能提升的情况。在一些测试中，人工智能模型的得分仅仅略高于普通人。这并不令人意外，因为人工智能的训练完全基于人类数据。

有人反驳说，这些测试是否太过简单了？是否需要更复杂的测试，就像 SAT 考试一样来真正衡量人工智能的能力？如果在 SAT 考试中，许多学生在数学和语言部分都得到 800 分的满分，这是否意味着评分标准过于局限？我们是否需要一种能够真正测试出爱因斯坦级别智慧的测试？现有的测试方法固然有其价值，但我们可以设想一种能够准确区分超高智商人群的 SAT 考试，一种能够真正衡量人工智能超越人类水平推理能力的测试。

霍洛维茨：事实确实如此。人工智能可能需要这样的测试。

此外，还有一个经常被人们提出的问题，也是我们内部一直在讨论的问题，即我们是否需要采取更具挑衅性、更乐观、或者说更具科幻色彩的预测。当用来自互联网的数据训练一个语言模型时，互联网数据集的本质是什么？它实际上是一切的平均水平，它是人类活动的一种代表。由于人口中智力分布的特点，大多数内容处于中等水平，因此被用于训练模型的数据集平均而言代表了普通人类。使用此类数据，我们只能训练出一个非常普通的模型。互联网上大部分内容都由普通人创造，所以整体而言内容是普通的，生成的答案也是普通的。根据定义，互联网中的答案平均而言是普通的。

如果用默认的提示词询问模型一些常规问题，如「地球是否绕着太阳转？」我们会得到一个普通的答案，这已经足够了。不过这里有一个关键点：虽然平均数据可能来自普通人，但数据集也包含了所有聪明人所写和所想的一切，所有这些内容都在数据集中。因此，这引出了如何通过特定的提示来引导人工智能，让它能够使用数据集中「超级天才」的内容进行训练。如果以不同的方式构建提示词，实际上可以引导人工智能沿着数据集中的不同路径前进，从而得到不同类型的答案。

举例来说，如果要求 AI 编写一段执行某项任务的代码，比如排序一个列表或渲染一张图像，它会给出普通的代码。但如果要求它编写安全代码，它实际上会生成更少安全漏洞的优质代码，这非常有趣。这是因为它访问了一个不同的训练数据集，即安全代码的数据集。再比如，如果要求人工智能以游戏开发大佬约翰·卡马克（John Carmack）的风格编写图像生成程序，你会得到一个好得多的结果，因为它能够接触到数据集中来自卡马克编写的代码，他可是世界顶级的图形程序员。可以想象，在许多不同的领域中通过精心设计的提示词，我们可以解锁人工智能潜在的超级天才能力，从而得到默认答案之外更优秀的答案。

安德森：我也赞同这个观点。我认为人工智能的智能可能存在一个潜在的极限。我们之前讨论过，世界非常复杂，而智能就是如何能够更好的理解、描述、代表这个世界。但当前的人工智能迭代中，由人类构建结构，然后再把构建出的结构输入到人工智能中，所以人工智能擅长预测人类如何构建世界，而不是世界实际是怎样的。后者可能更为复杂，也许在计算中不可简化。

我们是否会遇到一个极限，即人工智能可以非常聪明，但它的极限是与最聪明的人类一样聪明，而不是比最聪明的人类更聪明？还有一个相关的问题，人工智能能否想象出全新的事物，比如新的物理定律等等。当然，能够做到这一点的人类可能只有三十亿分之一，这是一种非常罕见的智能类型。所以，人工智能仍然极其有用，但如果它们是人工人类，而不是所谓的超级人类，那么它们扮演的角色会有所不同。

霍洛维茨：就拿人工智能性能可以提升百倍的超级乐观情况来说，愤世嫉俗的人会说，奥特曼宣称人工智能会优秀百倍。这恰恰是因为它们不会变得更好。奥特曼这么说基本上是出于恐吓的目的，阻止其他人参与竞争。

安德森：我认为，无论人工智能是否会优秀百倍，奥特曼都会宣称这一天终将会到来。对于那些不了解奥特曼的人而言，他是一位非常睿智的人。但毫无疑问，他是一位好胜心强的天才。所以在作出任何决定之前，必须考虑到这一点。

霍洛维茨：如果人工智能的性能提升有限，奥特曼可能会说它们会变得更好；但如果它们确实有望大幅提升，他同样也会从这个角度进行宣扬。毕竟，为什么不呢？现在，让我们来探讨一个乐观的论点，即人工智能的性能可能会提升百倍，甚至千倍，并长期保持上升趋势。虽然我将要提出的每个观点都可能存在争议，但在人工智能领域里，许多睿智的人都支持我的观点。

首先，神经网络内部正在出现泛化学习，这一点通过内省技术（introspection techniques）得到了证实。此类技术使我们能够观察神经网络内部的神经回路是如何在训练过程中演变的。神经网络正在发展出通用的计算功能。例如，最近有人通过在大量国际象棋游戏上训练神经网络，结果网络内部构建了一个棋盘模型，能够走出创新性的棋步。

此外，所谓的「过度训练」——即对同一模型使用相同数据进行更长时间的训练——实际上被证明是有效的。特别是，Meta 和其他一些公司最近一直在讨论所谓的过度训练实际上是如何工作的，即基本上继续对同一个模型进行训练，对相同的数据进行更长时间的训练，投入更多的计算周期。一些领域的专家甚至认为这种方法效果非常好，且不担心增加训练会导致收益回报递减。

安德森：在 Meta 最近发布的大语言模型 Llama 3 中，使用的主要技术就是过度训练。实际上，有专家告诉我们，目前我们可能不需要更多的数据来提升这些模型的性能，我们需要的是更多的计算周期。通过大幅度增加训练次数，人工智能的性能就有望得到显著提升。

霍洛维茨：监督学习（supervised learning）在数据标注方面对人工智能的提升作用不容小觑，它为这些模型带来了巨大的性能飞跃。

安德森：我们目前听到许多关于人工智能自我完善循环的传闻，这些循环正在积极进行中。该领域的许多前沿实践者认为，某种形式的自我完善循环已开始奏效。这涉及到让人工智能执行所谓的「思维链」（chain of thoughts），即让它逐步解决问题，直到它能够熟练掌握这一过程。不过通过在这些答案上对人工智能进行再训练，可以在推理能力的各个周期中实现类似于叉车式升级（即用户为了获得新技术所带来的好处，必须用新设备取代旧的硬件）的情况。许多专家认为，这种自我完善的方法现在已开始发挥作用。

此外，还有关于合成数据的讨论，尽管对此仍有激烈的辩论，但有相当一部分人对此持乐观态度。

还有，大语言模型可能在编写代码方面表现出色，但它们在验证代码方面可能更出色，实际上，相对于编写代码，大语言模型更擅长验证代码，这将是一个巨大的进步。这同时也意味着人工智能可能需要学会验证它们自己生成的代码，而它们确实具备这样的能力。我们对人工智能系统有一种拟人化的偏见，这可能会误导我们，因为我们倾向于将模型视为「它」。然后我们会产生疑惑，「它」怎么可能在验证代码方面比编写代码更出色。但人工智能不是单纯的「它」，它是一个巨大的潜在空间，一个庞大的神经网络。在这个网络中，编写代码和验证代码可能是由完全不同的部分组成，且这两者之间没有必然的一致性要求。

如果人工智能在其中一方面表现得更好，那么它擅长的部分有可能使其不擅长的部分也变得越来越好，这就是自我完善的潜力。

此外，还有许多其他因素也在推动人工智能的发展。例如，目前芯片的极度短缺限制了许多人工智能系统的潜力，但随着时间的推移，这种限制将逐渐解除。还有数据标注的问题，目前人工智能系统中已积累了海量的数据，但全球还有更多的数据等待挖掘。至少从理论上讲，一些领先的人工智能公司正在投入资金生成新数据；同时，即使是开源数据集的质量也在稳步提升。因此，我们可以预见到数据质量和数量的显著改进。

此外，大量资金正在涌入人工智能领域，为此类技术的发展提供了强有力的支持。同时，系统工程的工作也在同步进行，许多最初由科学家构建的系统，现在有了世界级工程师的加入。他们正在对这些系统进行精细调整，使其运行得更加高效。

霍洛维茨：也许这并不是一个简单的选择。这不仅使推理过程变得更加高效，而且也提高了训练过程的效率。

安德森：确实，我们还有其它改进的领域。例如，微软最近发布了该公司的小语言模型，有报道称它在性能上能与更大的模型一决高下。微软所做的关键工作之一是优化了训练集。具体来说，他们去除了训练集中的所有重复副本，专注于使用一小部分高质量数据进行训练，而不是依赖于大多数人所使用的大量低质量数据。把所有这些因素叠加在一起，我们得到了大约八到十个不同的改进方向组合，这些方向既有实践性的，也有理论性的，而且它们都在同步进行中。在我看来，很难想象这些因素的组合不会带来从当前水平起步的显著进步。

霍洛维茨：我完全赞同，这肯定会发生。就像回到奥特曼的问题或他的提议，如果你创办了一家人工智能初创公司，且认为自己的技术在两年内才能达到 GPT-4 的水平，那么你会考虑要不要再继续。

安德森：这涉及到许多创业者担心的问题。他们试图解决的问题是，我知道如何利用聊天bot，知道如何构建一个 SaaS 应用，也知道利用大语言模型来制作出色的营销材料。假设这是一个非常简单的事情，我为此构建了整个系统。会不会在 6 个月后，大模型仅通过简单的提示词就能更好地制作营销材料，从而使我那看似复杂的系统变得无关紧要，因为大模型直接做到了？

可以这样想，很多当前人工智能应用公司都被称为「GPT 套壳」，在 ChatGPT 周围有一层薄薄的包装，意味着 ChatGPT 可以将它们很容易商品化或取代它们。

当然，反方的观点有点类似于称所有旧的软件应用程序都是数据库包装者。事实证明，围绕数据库的包装就像大多数现代软件一样，很多这样的软件最终都非常有价值，而且围绕核心引擎有很多构建的东西。当企业考虑构建应用程序时，该如何思考呢？

霍洛维茨：这是一个非常棘手的问题，因为其中存在着正确性差距。比如，为什么我们有 Copilot 而不是人工智能驾驶员？目前没有人工智能飞行员，只有人工智能副驾驶。这实际上归结为，我们还无法信任人工智能系统在绘制图像、编写程序，甚至在没有编造引用的情况下撰写法庭简报时是正确的。所有这些事情都需要一个人，没有人的参与是相当危险的。

我认为，从应用程序层面来讲，为了使它真正有用，需要把副驾驶变成飞行员。我们能做到这一点吗？这是一个有趣且困难的问题。还有一个问题是，在模型层面更好地完成，还是在顶部的某一层完成？通过做一些事，比如使用代码验证提炼出正确的答案，还是说这只是模型能够做到的事情？我认为这是一个悬而未决的问题。

我认为有一个模型并不擅长的领域，那就是流程。在数据库世界里，就像数据库类比一样，有一部分任务是在律师事务所写简报，但还有 50 个其他任务和事情需要整合到公司的工作方式中，比如流程、编排等等。也许有很多这样的事情，比如如果在制作视频，有很多工具，比如谁将写歌词，哪个人工智能系统写歌词，哪个制作音乐，所有这些如何结合在一起，如何对它们进行整合等等。所有这些事情往往需要真正理解最终的客户等。这通常是应用程序与过去平台不同的地方，因为它们具有关于客户如何使用它的真正知识，这与平台设计的目的无关。把这些从平台中提取出来对于企业或个人而言非常的困难。所以，我认为这些事情可能会奏效，特别是如果流程非常复杂，这是有趣的事情。

安德森：我经常建议创始人们从定价策略的角度思考问题。也就是说，可以从最终的商业价值出发反向推导。

换言之，首先确定你的技术能为客户带来多少价值，然后基于此价值来设定价格。技术专家通常会首先考虑自己的技术能力，然后再决定如何把它商业化，并思考如何定价。他们会在成本和自己认为合理的加价之间寻找一个平衡点。如果他们拥有市场垄断地位，可能会设置更高的加价。这是一种以技术供应为导向的定价模式。

然而，还存在一种截然不同的定价策略，即基于价值的定价模式，这种模式关注的是产品或服务对客户的商业价值，而不是单纯的成本加成。

举例来说，如果我们谈论的是价值 100 万美元的商业机会，那么是否能够以此商业机会的 10% 定价，也就是 10 万美元作为价格？这种定价策略的逻辑在于，如果产品或服务对客户来说值 100 万美元，他们可能会愿意支付 10% 的费用来获取它。

霍洛维茨：在我们的投资组合中，就有一家专注于讨债等服务的人工智能初创公司。想象一下，如果能够通过一个副驾驶式的解决方案，用更少的人力追回更多的债务，那么这个解决方案的价值远远超过了购买 OpenAI 许可证的成本。因为 OpenAI 许可证本身并不能直接帮助追讨债务，而这家初创公司的解决方案能够显著提高讨债者的效率。

因此，关键在于如何弥合产品价值与客户支付意愿之间的差距。有一个非常重要的观点：检验你的商业想法是否优秀的一个重要标准是，你能够为其收取多少费用。你是按照为客户带来的价值来定价，还是仅仅根据客户需要投入的工作量来定价？在我看来，这才是真正的试金石，用以衡量你所创造的价值的深度和重要性。

安德森：确实，从技术投资者的角度来看，存在一些难以准确评估的企业类型。这些企业提供了针对商业问题的具体解决方案，而这些问题对客户来说价值巨大，因此他们愿意支付相当价值的一部分作为费用。这种模式意味着，即使企业在技术上的差异化不是非常明显，它们仍然可以非常赚钱。而且，由于这些业务的盈利能力，它们实际上有能力深入思考技术如何融入业务，以及它们还能做些什么。例如，Salesforce.com 的成功故事就是如此。

霍洛维茨：还有一种观点认为，随着所有模型的性能都在迅速提升，且有开源模型如 Llama 和 Mistral 等优秀的模型可供使用，真正的价值创造点将在于工具的编排和整合，因为你可以简单地插入当时最佳的模型。而模型本身将在市场上相互竞争，最终可能会商品化，成本最低的模型将会胜出。因此有人认为，最佳策略是将强大的人工智能技术带给人们。

投机热潮背后的真相：

AI 投资的现实与幻想

安德森：有人询问「为什么风险投资公司在明知 AIGC 初创公司近期不会盈利的情况下，仍然对此类公司进行巨额投资？」还有人问「如果人工智能降低了创办初创公司的成本，技术投资的结构将如何变化？」基本上讲，这两个问题是完全对立的。

如果从一个角度看，会看到投资基础模型公司的资本正在以惊人的速度增长。此类初创公司正在筹集数亿、数十亿甚至数万亿美元，这让人不禁惊叹于这些公司的资本规模。但如果从另外一个角度看，你会发现，现在构建软件变得容易得多，拥有一家软件公司或让一小群程序员编写复杂软件变得容易得多，因为他们得到了人工智能助手和自动化软件开发能力的支持。因此，创办一家人工智能应用初创公司的成本可能会大幅下降，可能起步资金只需要创办 Salesforce.com 成本的十分之一、百分之一或千分之一。我们如何看待这种二元性，即从任何一种角度都可以看到成本要么大幅飙升，要么实际上趋近于零。

霍洛维茨：我们确实对这两种类型的初创公司都有投资。我认为，历史上最快实现盈利的公司，是那些营收增速远远超出成本支出的人工智能公司。在我们的投资组合中，这些人工智能初创公司的营收增速都相当快，实际上增速已经超过了成本增速。

同时，开发基础模型募集到数亿甚至数十亿美元的初创公司，它们也在不断地快速产生营收，而且所有这些公司的员工人数都很少。因此我会说，甚至是像 OpenAI 这样的初创公司，从员工人数相对于其营收的角度来看，他们并不是一家大公司。如果你看看它们的营收水平以及他们达到这个水平的速度，员工人数是相当少的。当然，此类初创公司的总支出是巨大的，但它们都投入到了模型的创建中。这是一个有趣的事情，我不确定该如何完全理解它，但我认为，只要不是在构建基础模型，它将使初创公司的运营更高效，并可能更快地实现盈利。

安德森：有一种非常乐观的反论点，即建立新软件公司成本的下降可能只是一种幻觉。这背后的原因是经济学中的一个现象，称为吉芬悖论（Jevons Paradox）。吉芬悖论是指技术进步提高了资源使用效率，从而减少了任何单一用途所需的资源量，但资源成本的下降又刺激了需求增加，这种需求的增长弹性足以使资源的总体使用量增加而非减少。我们可以看到这种现象的案例，例如高速公路实际上加剧了交通拥堵。原因基本上是，有了更多的道路，可以容纳更多的人居住在这里；企业可以扩大规模，结果车辆比以往任何时候都多，交通状况变得更加糟糕。或者可以想到工业革命期间煤炭消耗的经典例子。随着煤炭价格的下降，人们使用的煤炭量实际上比以往任何时候都多。尽管人们获得了更多的动力，但结果是使用了更多的煤炭。

这里的悖论是，尽管开发任何特定软件的成本下降，但对此的反应是对软件能力的需求激增，因此尽管看起来像软件公司的起始价格将会下降，但实际上将发生的情况是，由于软件能够实现的功能大大增加，产品质量将会大幅提升，产品路线图将会非常激动人心，客户将会非常满意，他们希望获得更多，因此结果将是开发成本实际上上升了。以好莱坞为例，CGI（计算机生成图像）理论上应该降低了制作电影的成本，但实际上却增加了，因为观众的期望上升了。现在看好莱坞电影，满满当当的 CGI 特效。因此，电影的制作成本比以往任何时候都要高。至少在好莱坞，结果是电影在视觉上更加精致，无论它们是否更好是另一个问题，但它们在视觉上更加精致，更具吸引力，令人惊叹。

在软件方面，因为终端用户能够获得更好的软件，这让他们想要得到更多的软件，进而导致软件的开发成本上升。

霍洛维茨：思考一下旅行这样的简单案例。通过 Expedia 预订旅行是复杂的，用户需要点击不同的界面，很可能会出错。而人工智能版本的预订系统将是：送我去巴黎；让我住在我最喜欢的酒店；以最好的价格为我安排最好的航空公司机票；让这次旅行对我来说非常特别。你也可以让人工智能提供的服务变得更加复杂。比如说：我们知道这个人喜欢巧克力，我们将从瑞士通过联邦快递把世界上最好的巧克力送到巴黎的这家酒店等等。可以说，人工智能提供的服务可以达到我们今天甚至无法想象的水平。目前还做不到这些，仅仅是因为软件工具还不是它们将要成为的样子。

安德森：我完全赞同你的观点。设想一个场景：我于傍晚六点抵达波士顿，期望与一群极具魅力的人士共享晚宴。

霍洛维茨：确实，这样的安排在当下是任何旅行社都无法提供的。当然，你也未必希望旅行社介入。

安德森：不过你会逐渐意识到，这种个性化的体验需要与我的个人 AI 紧密结合。创意的无限可能，以及人类创造新事物的能力，一直是被低估的。这种能力似乎是无穷无尽的。20 世纪上半叶的杰出经济学家约翰·梅纳德·凯恩斯（John Maynard Keynes）曾预言，随着自动化的普及，人们将不再需要每周工作 40 小时。凯恩斯认为，一旦基本的生活需求——如食物和住所——得到满足，人们就无需再为生存而工作。但随着时间的推移，人们的需求也在不断增加，从冰箱、汽车、电视到享受假期，需求似乎永无止境。未来我们还会需要什么我无法预知，但可以肯定的是，总有人能够预见并创造出新的需求，这些需求很快就会变得极具吸引力。

霍洛维茨：凯恩斯在著作《我们后代的经济前景》中提出了这一观点。同样，卡尔·马克思（Karl Marx）也曾表达过类似的看法。他认为. 在社会主义乌托邦实现后，社会将能够调节总体生产，从而让个人能够自由地从事各种活动。马克思曾描述：「在早上打猎，在下午钓鱼，在晚上养牛，在晚餐后指点江山。」这种生活图景描绘了一种理想的生活状态。如果我必须列出四件我不愿意从事的活动，那么它们将是打猎、钓鱼、养牛和指点江山。

凯恩斯和马克思的共同点在于，他们都对人们想要做什么持有一种非常有限的看法。此外，人们渴望拥有使命感，希望拥有事业心，追求目标，成为有用的人，在生活中发挥积极作用。这一发现在某种程度上是令人惊讶的。因此，我一直认为，软件的需求基本上是完全弹性的，可能无限增长。随着软件成本的持续降低，需求也会随之增长。因为在软件领域，总有新的事项可以完成，总有新的自动化、优化和改进的空间。一旦当前的约束条件消失，人们就会想象出新的可能性。

以人工智能为例，目前一些公司正在开发具有高级功能的人工智能安全摄像头系统。在过去，能够处理和存储来自不同摄像头的视频流，并提供回放界面的软件，就已经被认为是技术上的一大进步。然而，现代的人工智能安全摄像头已经能够对环境中发生的事情进行实际的语义理解。它们能够识别特定的人，并根据他们的行为和表情判断是否存在异常情况。例如，系统可以识别出有人携带枪支是因为他有打猎的习惯；而其他人通常不会携带枪支，如果突然携带枪支并表现出愤怒的表情，系统就会判断出可能存在危险。这种具有语义理解的安全系统显然比传统的安全系统要复杂得多，其制造成本也可能更高。

霍洛维茨：设想一下，在医疗保健领域，我们能够做到每天早上醒来时，进行一次全面的自我诊断，以了解自己的健康状况。例如，我们可以询问：「我今天感觉如何？我所有的生理指标都在什么水平？」以及「我应该如何解读这些数据？」在医学诊断领域，人工智能特别擅长处理高维度数据问题。当能够获取连续的血糖读数、偶尔进行血液测序等数据时，我们就能获得对个人健康状况的深入洞察。追求更健康的生活是每个人的愿景。目前，我们日常的健康监测手段，如体重称重或心率监测，与未来可能实现的高级健康监测相比，显得十分原始。

「数据是石油」

可能是一种假象

安德森：关于数据的讨论，有人提出了问题：随着人工智能模型的发展，它们允许我们以极小的成本复制现有的应用程序功能，这使得专有数据似乎成为了最宝贵的资产。在你看来，这将如何影响专有数据的价值？在这种新兴环境下，企业应该集中精力构建哪些其他类型的资产？

还有人问：在人工智能的新时代中，企业应如何保护敏感数据、商业机密、专有数据以及个人隐私？

为了引出讨论，我将从一个可能引起争议的观点开始，即「数据是新石油」。这种观点认为，数据是训练人工智能、推动其运作的关键输入。因此，数据成为了一种全新的、限制性的、极具价值的资源。在人工智能训练过程中，这一点体现得尤为明显。许多公司在探索如何利用人工智能时，常会强调他们拥有的专有数据。例如，医院、保险公司或其他类型的企业可能会声称，他们拥有大量专有数据，可以利用这些数据与人工智能结合，创造出其他人无法轻易获得的成果。

不过我要提出的观点是，在几乎所有情况下，这种看法并不成立。这实际上只是一种模仿现象。互联网上以及更广泛环境中可用的数据量是如此庞大，以至于尽管可能没有个人的具体医疗信息，但我已经能够从互联网上获取到众多人在多种不同情况下的医疗信息，这些数据的海量足以压倒性地超越所谓的「个人数据」的价值。因此，对于社交媒体平台 X 而言，其专有数据在某些方面可能略有用处，但实际上并不会带来显著的影响，而且在大多数情况下也不会成为一个关键的竞争点。

支持我这种观点的证据是，至今我们并未看到一个丰富或成熟的数据市场。实际上，不存在大型的数据交易市场。相反，我们看到的是一些规模较小的数据处理市场，如数据经纪人，他们向客户出售大量互联网用户的信息，但这些业务的规模相对较小。如果数据真的具有巨大价值，它就会有明确的市场价格，并且我们会看到它在市场上的交易。然而，我们并没有看到这种情况，这在某种程度上证明了数据的价值并不像人们想象的那么高。

霍洛维茨：我赞同这种观点。原始数据——那些未经任何处理的数据集——其价值往往被过分夸大。我完全同意这一点。尽管我能够想象到一些例外，例如某些特殊的人群基因数据库，它们可能难以获取，并且在某些研究领域具有独特价值，这些数据并不是随便可以在网络上找到的。我可以设想，这些数据是高度结构化的、通用的，并且不易被广泛获取。然而，对于大多数公司所持有的数据而言，情况并非如此。这些数据要么是广泛可获取的，要么是特定性的而非通用的。

尽管如此，一些企业已成功地利用数据来提升业务成果。

以 Meta 为例，该公司就利用其数据取得了显著成效，通过将数据输入自己的人工智能系统，以惊人的方式优化其产品。我相信，几乎每家公司都能够通过利用自身的数据来增强其市场竞争力。但是，认为公司只要收集了一些数据，就能像出售石油一样将其变现，或者认为这些数据就是新的石油资源，这种想法实际上是不切实际的。

有趣的是，许多我们认为最有价值的数据，比如企业自己的代码库——即企业编写的软件，很多都存放在 GitHub 上。据我所知，在我们合作过的任何一家企业中，没有哪家企业正在基于自己的代码建立独立的编程模型，或者这是否是一个好主意，这可能是不必要的，因为已经有大量的代码存在，且系统已经在这些代码上进行了充分的训练。因此，这并不是一个显著的优势。我认为，只有非常特定类型的数据才具有真正的价值。

安德森：让我们把这一观点转化为具体的行动指南。假设我管理着一家大型公司，如保险公司、银行、医院集团，或者是像百事可乐这样的消费品公司，我该如何验证我实际上拥有一个有价值的专有数据资产，并且我应该集中精力去利用它，而不是将所有努力都投入到尝试优化使用该数据上，或者完全转向使用互联网数据来构建解决方案呢？

霍洛维茨：以保险业务为例，如果你身处该行业，那么你的所有精算数据都是有趣且相关的。我不确定是否有人公开发布过他们实际的精算数据。因此，我不确定你如何能够仅凭互联网上的数据来训练模型。这是一个值得探讨的好问题。

安德森：让我提出一个挑战性的假设：假设我是一家保险公司，拥有 1000 万人的记录，包括他们的精算表、生病和去世的时间等信息，这听起来很不错。但是，互联网上已经有大量关于大规模人群的一般精算数据，因为政府会收集这些数据，进行处理，并发布报告，同时还有众多第三方和学术研究的数据。你的大型数据集是否为您提供了任何额外的精算信息，而这些信息在互联网上的更大数据集中尚未提供？您的保险客户在精算上是否真的与普通人群有所不同？这些问题值得每一位数据管理者深思。

霍洛维茨：我认同这样的观点：在保险业务中，当客户申请保险时，公司通常会要求进行血液测试等健康检查，以获取客户的健康状况信息。这些信息包括客户是否吸烟等生活习惯，对于保险公司来说，这些都是重要的数据。然而，在一般的数据库中，虽然可以知道谁去世了，但往往不清楚这些人之前的具体健康状况和生活习惯，因此，保险公司真正寻求的是，对于具有特定档案和实验室结果的人群，他们的预期寿命是多长，这也正是数据价值所在。

有趣的是，像 Coinbase 这样的公司，在防止非法入侵方面拥有极其宝贵的资产。他们在这方面投入了大量的工作，并且肯定积累了大量关于各种入侵尝试的数据。这些数据可能非常特定于试图非法进入加密货币交易所的人群，因此，这些数据对 Coinbase 来说可能非常有用。我不认为他们能够将这些数据出售给任何人，但我认为，如果每家公司都能将数据输入到一个智能系统中，都会有助于他们的业务。我认为几乎没有公司拥有可以简单出售的数据。

同时，还有一个中间问题需要考虑，那就是哪些数据是你愿意让微软、谷歌或 OpenAI 等公司获取的。我认为，企业正在努力解决的不是我们是否应该出售我们的数据，而是我们是否应该训练自己的模型以最大化价值，或者我们是否应该将数据输入到大型模型中。如果我们将数据输入到大型模型中，所有的竞争对手是否都会获得我们刚刚输入的信息？我们能否信任大公司不会利用我们的数据？如果企业的竞争力依赖于此，那么可能不应该这么做。

安德森：是的，至少有报道指出，某些大公司正在使用他们本不应该使用的各类数据来训练他们的模型。

霍洛维茨：我认为这些报道很可能是真实的。或者，他们应该开放数据。我们之前已经讨论过这个问题，那些声称没有窃取人们数据或以未经授权的方式获取数据的公司，却拒绝透露他们的数据来源。为什么不告诉我们你的数据来自哪里？事实上，他们试图关闭所有开放性——没有开源、没有开放权重、没有开放数据、没有任何开放的东西，并且试图让政府这样做。如果你不是窃贼，那你为什么要这么做？

安德森：确实如此。举个保险领域的事例，使用遗传数据进行保险目的是非法的。美国有一项名为《2008 年遗传信息非歧视法案》的法律，基本上禁止了美国的健康保险公司使用遗传数据进行健康评估。顺便说一下，由于基因组学正在变得非常先进，这些数据如果真的用于预测人们何时会生病和去世，可能是最准确的数据之一。而他们实际上被禁止使用这些数据。

霍洛维茨：我认为这是一个有趣的例子，它反映了良好意图在政策制定上的奇怪误用，这可能导致的死亡人数可能比 FDA 等所有健康政策所拯救的人数还要多。

在人工智能领域，获取关于所有人的生病原因、他们的遗传信息等数据，是最宝贵的资源。这就像是「新石油」。如果能够将这些信息匹配起来，我们将会知道为什么生病，能够使每个人都更健康。但为了阻止保险公司对更有可能去世的人进行过高收费，我们实际上封锁了所有这些数据。更好的办法是，对于那些更有可能需要的人，我们大规模地补贴医疗保健，就像我们通常对个人所做的那样，然后解决这个问题，而不是封锁所有数据。

安德森：关于保险，有一个有趣的问题是，如果你拥有关于个体结果的完全预测性信息，保险的整个概念是否仍然有效？因为保险的全部理论是风险共担。你不知道具体案例将会发生什么，这意味着您建立这些统计模型，然后进行风险共担，然后根据发生的具体情况有可变的赔付。但如果您因为拥有所有这些预测性的基因组数据而确切地知道每个案例将会发生什么，那么风险共担突然就不再有意义了。你只会说，这个人将会花费 X，那个人将会花费 Y。

霍洛维茨：现行的健康保险体系在本质上似乎并不合理。保险的概念源自于农业保险，即农民们共同出资建立一个基金，以让个别人农作物歉收时能够得到补偿。这种机制旨在应对灾难性的、不太可能发生的事件。然而，现实中，每个人都需要就医，且人们的健康状况各异，但健康保险却通过一个增加成本、官僚程序和大型公司的复杂系统来运作。如果我们的目标是为人们的健康买单，为什么不直接为医疗保健服务买单呢？此外，若要阻止人们过度就医，提高自付额似乎是一个更直接的方法。

安德森：从正义和公平的角度出发，如果预知某人的医疗费用将高于他人，是否应由我为其支付更多？如果我们可以准确预测个人的医疗成本，或者拥有一个高效的预测模型，那么社会成员共同分担医疗费用的意愿可能会显著下降。

霍洛维茨：遗传上的因素是个人无法控制的，但个人的行为却可能显著增加患病的风险。因此，我们或许可以通过激励措施来鼓励人们保持健康，而不仅仅是支付医疗费用以延长生命。在我看来，美国当前的医疗保险系统设计极度不合理，存在许多可以改进的地方。与其他一些国家相比，美国的体系显得十分荒谬。

AI 的发展不会复现互联网的发展，

AI 投资泡沫肯定会出现

安德森：有人提问，当前人工智能的发展与互联网 1.0 时代之间最显著的共同点是什么。对此，我提出一个理论。

由于我在互联网早期的角色，以及你在网景公司的经历，我们经常面对这样的问题。互联网的兴起是技术史上的一个重要事件，至今仍被许多人铭记。人们倾向于通过类比来进行推理，认为人工智能的兴起必然与互联网的繁荣相似，创办人工智能公司也许类似于创办互联网公司。然而，我们实际上收到了许多类似的问题，它们都是关于类比的。我个人认为，这种类比在很大程度上并不适用。尽管在某些方面它确实有效，但在大多数情况下并不适用。原因在于，互联网是一个网络系统，而人工智能则是基于计算机的技术。

霍洛维茨：的确如此。

安德森：为了增进理解，我们可以将当前的讨论与个人电脑的兴起或与微处理器的发展相类比。我的类比可以追溯到大型机的时代。互联网的显著成就在于它作为一个网络，将众多现有的计算机连接在一起。当然，人们也为了与互联网相连而设计了各种新型计算机。但关键点在于，互联网的本质是一个连接的网络。这一点至关重要，因为互联网行业的动态、竞争格局以及初创企业的活动大多与构建网络或开发网络应用程序有关。互联网时代的初创企业深受网络效应的影响，以及当你将大量人群连接起来时所产生的正反馈循环，例如梅特卡夫定律所描述的网络价值随着用户数量的增加而增长。

尽管人工智能领域也存在网络效应，但其更类似于微处理器或芯片，即作为一台计算机。它是一个系统，数据输入、处理、输出，然后产生结果。这是一种新型计算机——概率计算机，一种基于神经网络的计算机。它并不总是给出精确的结果，有时甚至可能与你争辩，拒绝回答你的问题。

霍洛维茨：这种新型计算机在本质上与传统计算机截然不同，它能够以更压缩的形式构建复杂事物。它拥有新的、不同的、有价值的能力，因为它能理解语言和图像，完成以往确定性计算机无法解决的任务。我认为，从计算机行业的早期或微处理器的早期阶段汲取的类比和教训，比互联网早期的经验更为贴切。这并不意味着技术发展过程中不会出现繁荣与萧条的循环，因为人们对技术的期望往往会经历从过度兴奋到过度悲观的转变。我们可能会看到芯片和能源等方面的过度投资，但我认为，网络的本质和计算机的发展路径在演变方式上有着根本的不同，其采用曲线也将有所不同。

安德森：这引出了我对行业未来发展方向的思考。

我们面临的一个关键问题是：这个行业将如何发展？是会出现几个大型模型，还是会有大量不同规模的模型？

计算机行业的历史，特别是最初的 IBM 大型机时代，为我们提供了洞见。这些大型计算机庞大而昂贵，数量有限。当时的普遍观点是，世界上只需要几台计算机。IBM 的创始人托马斯·沃森（Thomas Watson）甚至认为，全世界可能只需要五台计算机。这种观点是基于政府和几家大型保险公司的需求。然而，随着计算机产业经历了 50 年的发展，我们看到了计算机技术的多样化和普及。

霍洛维茨：是的。还有谁会需要做那么多的数学运算呢？

安德森：究竟是谁还需要去跟踪那些庞大的数字？又有谁需要那么高水平的算力？这种需求在当前看来似乎并不相关。顺便一提，早期的计算机不仅体积庞大，而且价格昂贵，这使得它们成为了只有少数人能够负担得起的奢侈品。除了购买成本，还需要考虑到维护这些计算机所需的人力成本。在那个时代，计算机的体积之大，以至于需要专门为它们建造一整栋建筑。你会看到穿着白色实验室外套的工作人员，他们负责照看这些计算机，因为必须保持极高的清洁度，否则计算机就可能停止工作。

这种情景催生了所谓的「AI 上帝模型」，即大型基础模型的概念，以及「上帝大型机」的想法，即只有少数几台这样的设备存在。如果你看过老科幻电影，通常会有这样的设定：存在一台大型超级计算机，它要么在执行正确的任务，要么在做错事，如果它在做错事，那么电影的情节通常就是围绕如何修复或击败它展开的。这种单一的、自上而下的概念在最初的几十年里一直持续存在。

随着计算机开始变得更小，我们进入了所谓的「小型计算机」时代，这是下一个阶段。小型计算机的成本虽然从 5000 万美元降低到了 50 万美元，但对于普通人来说仍然是一笔巨大的开支。因此，只有中等规模的公司能够购买小型计算机，而普通家庭则无法承担。随后，个人电脑的出现进一步降低了成本，大约在 2500 美元左右，而智能手机的出现则进一步将成本降低到了大约 500 美元。到了今天，计算设备已经变得无处不在，它们有着各种各样的形状、大小和功能，甚至有些计算设备的成本只有一分钱，比如控制房间温度的恒温器中的嵌入式 ARM 芯片。全世界有数十亿这样的设备，而一辆新车中可能包含多达 200 台计算设备，甚至更多。现在，我们普遍认为几乎所有的设备都内置了芯片，并且这些芯片都需要电力或电池来供电。此外，我们也越来越多地假设这些设备都连接到了互联网上，因为几乎所有的计算机都被假定为要么已经在互联网上，要么很快就会连接到互联网上。

因此，今天的计算机行业形成了一个巨大的金字塔结构。在金字塔的顶端，仍然有一小部分超级计算机集群或大型主机，它们就像上帝模型或上帝主机。接下来是数量更多的小型计算机、个人电脑、智能手机，以及数量庞大的嵌入式系统。计算机行业包含了所有这些不同类型的设备。根据你的需求、身份和目的，你可以选择不同大小的计算机。如果这个类比成立，那么它基本上意味着我们将拥有各种不同大小、形状和能力的 AI 模型，这些模型将基于不同类型的数据进行训练，并在不同的规模上运行，拥有不同的隐私政策和安全政策。你将面对巨大的多样性和变化，形成一个完整的生态系统，而不仅仅是由几家公司所主导。

霍洛维茨：我认为这个观点是正确的。

此外，我认为在这个时代，计算领域另一个有趣的事情是，如果我们回顾从大型机到智能手机的整个计算时代，因为设备操作难度大，反而牢牢锁定了用户群体。正如一句俗语，「从来没有人因为购买 IBM 设备而被解雇」，这是因为人们已经接受了相应的培训，掌握了使用操作系统的技能。鉴于处理计算机的庞大复杂性，选择一个已知且安全的选项是合理的。即使是在智能手机领域，例如苹果的智能手机，它们之所以能够占据主导地位，部分原因在于转换到其他系统的成本非常高昂且过程复杂。

这引出了一个关于人工智能的有趣问题。因为到目前为止，人工智能是最容易使用的计算机系统，它能够使用英语进行交流，就像与人交谈一样。因此，这里存在何种形式的锁定？用户是否可以完全自由地选择他们特定任务所需的计算机大小、价格、性能和速度？或者，他们是否被锁定在某个「上帝模型」中？我认为这仍然是一个尚未完全解决的问题，但它非常引人入胜，并且可能与以前的几代计算机系统有很大的不同。

安德森：很有道理。为了完成这个问题，你认为我们从经历的互联网时代中学到的哪些教训是相关的，人们应该考虑哪些因素？

霍洛维茨：我认为其中的一个重要教训是，互联网时代的兴衰周期性。

可以看到，对互联网的需求和对其潜力的认识是如此之高，以至于资金像倾盆大雨一样涌入。在互联网时代，基础电信设施和光纤等设施获得了无限制的资金支持，导致光纤的过度建设。最终，我们遭遇了光纤过剩的局面，许多电信公司随之破产，最终我们还是达到了一个良好的状态。我认为这种情况很可能在人工智能领域重演，每家公司都可能获得资金支持，但我们实际上并不需要那么多的人工智能公司，因此许多公司将会失败，将会有巨大的投资者损失。可以肯定的是，芯片的过度生产将在某个时刻发生，我们将会有过多的芯片，一些芯片公司肯定会破产。同样的情况也可能发生在数据中心等方面，先是落后，然后过度建设，这是每种新技术发展的自然规律。新技术的发展往往会经历过度建设、不足建设，然后再过度建设的循环。在这个过程中，资金的涌入推动了基础设施的建设，尽管许多资金会损失，但我们获得了基础设施，因为它真正被采用并改变了世界。

互联网发展的另一个重要方面是，它经历了几个阶段。一开始，互联网非常开放，这可能是对经济最有利的一次大繁荣，它无疑创造了巨大的增长和力量，增强了美国的经济实力和文化影响力。然后，随着下一代架构的出现，互联网变得封闭，比如互联网的发展几乎完全由谷歌等公司控制。我认为 AI 可能会朝两个方向发展：它可以非常开放，或者由于错误的监管，我们可能会迫使自己从开放源代码、任何人都可以构建的技术，转变为只有今天拥有互联网的公司拥有的技术，这将使我们在与中国等国家的竞争中处于巨大劣势。因此，我认为这是我们目前正在努力确保不会发生的事情，但它确实是目前一个真正的可能性。

安德森：网络曾经完全是专有的，但随后它们开放了。

霍洛维茨：是的，没错，像 AppleTalk、NetBEUI 和 NetBIOS 这些都是早期由各个特定供应商提供的专有网络。

安德森：然后互联网出现了，随着 TCP/IP 等技术的发展，一切都开放了。不过人工智能领域似乎正朝着另一个方向发展：大公司正试图将人工智能带向相反的方向。人工智能起初是开放的，就像基础研究一样。但现在，他们正试图将其封闭起来，这是一种相当不良的转变。

霍洛维茨：是的，非常不良。对我来说，这确实令人震惊。这在某种程度上是资本主义最黑暗的一面，当一家公司如此贪婪，以至于他们愿意为了获得一点点额外的利润而破坏国家乃至世界。但他们这样做的方式非常恶劣：他们声称这是为了安全，声称我们创造了一个无法控制的人工智能，但我们不会停止开发，我们会尽可能快地继续构建它，我们会购买地球上的每一个 GPU。但我们需要政府介入，阻止它的开放。这正是谷歌和微软目前的立场，这太疯狂了。

安德森：我们不会去保护它。

霍洛维茨：这与安全无关，只与垄断有关。

安德森：是的，关于你提到的投机问题，有一种我们经常听到的批评声音，基本上是说：「你们这些企业家、投资者真是愚蠢，每次新技术出现时都会产生投机泡沫，你们这些人怎么就学不乖呢？」嗯，这里有一个老笑话与此相关，那就是在投资中四个最危险的词是「这次不一样」（this time is different）。所以，历史会重演吗？它不会重演吗？

不可否认的是，历史上几乎每一次重大技术进步都伴随着某种金融泡沫，基本上是自从金融市场存在以来一直如此。这包括了从无线电、电视到铁路等一切事物。顺便说一下，60 年代实际上有一个被称为「Tronics」的电子繁荣与萧条周期，当时每家公司的名字都带有「Tronics」。还有激光繁荣与萧条周期，所有这些周期。

基本上，任何一种新技术，经济学家称之为「通用技术」，即可以用于许多不同方式的东西，都会激发一种投机狂热。而批评的声音是，「为什么你需要有这种投机狂热？为什么你需要有这个周期？因为你知道，有些人投资于某些事物，他们损失了很多钱，然后会有这样一个泡沫破裂周期，让每个人都感到沮丧。这可能会延迟技术的推广。」

有两件事情需要指出：第一，如果你面对的是一种通用技术，像人工智能这样可能在许多方面都有用的技术，实际上没有人事先真正知道成功的用例或成功的公司会是什么。你必须要通过实践来学习，你会有失败，这是风险投资的一部分。是的，我们确实如此。所以，风险投资的真正模型在某种程度上已经考虑了这一点。在核心风险投资中，我们所做的那种，我们基本上假设一半的公司会失败，一半的项目会失败。如果你完全失败，比如亏钱了，那确实是一个问题。

霍洛维茨：完全失败确实就如同亏钱一般。

安德森：当然，如果我们或我们的任何竞争对手能够找出如何只做那 50% 能成功的工作，而避免那 50% 不成功的工作，我们肯定会这么做。但现实是，我们已经在这个领域进行了 60 年的研究，但没有人找到这样的方法。因此，这其中存在不可预测性。而且，另一个有趣的思考方式是，如果一个社会对新技术的出现没有投机行为，那将意味着这个社会基本上对新技术的前景以及创业精神持有一种根深蒂固的悲观态度。

世界上有许多这样的社会，它们根本缺乏像硅谷这样的地方所拥有的发明精神和冒险精神。而它们是更好还是更糟呢？通常来说，它们的情况更糟。它们对未来的关注较少，对创造事物的关注较少，对如何实现增长的关注也较少。所以，我认为这是「不可避免的现象」，我们当然希望避免投机性繁荣和萧条周期的负面影响，但似乎每次新技术的出现都会伴随着这种情况，至少据我所知，没有任何一个社会能够找到一种方法，只获得好处而不经历坏处。

霍洛维茨：为什么你不愿意呢？我的意思是，这有点像，你知道，整个美国西部是建立在淘金热的基础上的，而流行文化中对淘金热的描述往往集中在那些没有赚到钱的人身上。但实际上，有些人确实赚了很多钱，找到了金子。在互联网泡沫时期，你知道，这被每部电影嘲笑，如果你回顾 2001 年到 2004 年之间的任何电影，它们都在说只有傻瓜才会做这做那，还有很多有趣的纪录片等等。但在那个泡沫时期，亚马逊、eBay 和谷歌等公司开始了它们的业务。这些公司是在那个充满巨大投机的时代成立的，而这些公司中确实有「金子」。如果你投资了其中任何一家公司，你可能会投资下一个公司，包括 Facebook、Snap 等。

所以，这就是它的本质，这就是它令人兴奋的地方。你知道，将资金从那些资金充裕的人转移到那些尝试做新事物、使世界变得更美好的人手中，是世界上最好的事情。如果我们中的一些人在试图使世界变得更好的过程中失去了一些多余的资金，你为什么会对此感到愤怒呢？这是我永远无法理解的事情。为什么会对那些获得资金、试图改善世界的年轻有抱负的人感到愤怒呢？

文章来源于“Founder Park ”，作者“Founder Park”

a16z创始人对谈AGI创业：AI能力存在上限、不要笃信「数据是石油」、AI泡沫肯定会发生

关键词: AGI , a16z , AI , 人工智能 , 大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0