硅谷VC看生成式AI：做AI淘金热“卖水人”，应用层数据壁垒是重点

12098点击 2024-06-13 11:25

AI投资挑战大，硬件层与数据壁垒关键。

2024年以来，以Sora、Kimi为代表的生成式AI产品崛起，在全球范围内引领了新一波技术创新的潮流，同时也为硅谷注入了新的投资机遇。

在本期《AI未来指北》中，我们与硅谷华人投资人、清源创投（Foothill Ventures）创始合伙人王金林连线，带来了当前AI领域投资的硅谷视角。

清源创投是美国硅谷具有华人背景的风投基金之一，其布局的AI企业有人工智能芯片公司D-matrix、存算一体计算芯片公司TetraMem等，Ascend Element也成了电池回收领域的独角兽企业。

作为技术出身的投资人，王金林本硕毕业于清华大学，博士毕业于康涅狄格大学。王金林曾任Answers的CTO及COO，公司被Apax Partners近十亿美金收购、创立SaaS企业软件公司Auryc并任CEO至被成功收购。

核心观点

① 大语言模型出现后，早期投资变得更具有挑战。大语言模型的兴起对VC投资人来说是具有挑战的：在模型层，主要是一些大公司在投，这类创新形态并不适合VC去投资；在应用层，许多初创企业依赖于大公司开发的大模型，并不具备自己的护城河。

② 若把掘金生成式AI比作美国西部大开发时期的“淘金热”，在AI投资中，不光要关注“挖金子”的企业，那些不直接参与竞争，却在AI产业中承担“卖水人、卖牛仔裤”角色的企业也同样有机会，比如算力、AI芯片、边缘计算、内存融合技术、光通讯等等。

③ 对于早期投资人来说，AI应用层的投资机会并不如预期那么大，数据壁垒是关键。尽管医疗等行业具有巨大的应用潜力，但市场上的大语言模型数量需求有限。对于初创公司来说，如果仅仅是利用大语言模型对已有应用进行改进，而没有自己的技术或商业化壁垒，那么成功的机会可能会相对较小。相反，一家公司如果拥有独特且优质的数据资源，将能够在大语言模型的基础上开发出具有竞争力的企业服务。

④ 在投资框架上，AI投资可以大致划分为四个层次：硬件和基础设施层、大语言模型层、工具和平台层、垂直应用层。除了模型层之外，其他三个领域都具有投资潜力。在美国，相较于C端应用的赢家通吃格局，B端应用具有非常丰富的生态。

硅谷VC看生成式AI：做AI淘金热“卖水人”，应用层数据壁垒是重点

清源创投（Foothill Ventures）创始合伙人王金林

以下为具体访谈内容：

大语言模型面世后，风投更困难了，关注AI淘金热中的“卖水人”

腾讯科技：去年朱啸虎和傅盛有一场知名“辩论”：朱啸虎给大模型创业泼了一盆冷水，认为99%的价值都是GPT创造，依附于GPT的创业公司本身的价值不大；傅盛则认为，GPT是一个平台，创业者可以基于这个平台衍生出各自不同的价值。作为硅谷VC，您怎么看这轮大语言模型带来的投资机会？

王金林：我们反而觉得，这一波大语言模型的兴起，对于我们这样的VC投资人来说是具有挑战的。我个人比较赞同朱啸虎所说的，大语言模型出来之后，投资变得更加困难了。为什么？

首先，因为大模型主要是一些大公司在投。比如，2024年3月底亚马逊宣布已完成对Anthropic的40亿美元投资，来推进生成式AI技术的发展。

目前美国大型语言模型公司包括OpenAI、Anthropic、Cohere，还有Meta推出的Llama、Llama 2等等。这类创新形态，并不适合我们这样的VC去投资，包括中国国内的VC也不适合，或许阿里这样的大公司会投资，这是他们作为大公司必须在大模型占据一定的战略地位。

第二类是基于大语言模型的很多应用。比如很多项目号称要用大语言模型来改造市场营销的流程、帮助销售人员提升效率。我们看了很多这类公司，但都觉得这类公司技术过于单薄，并不具备长期的护城河，基本上就很难投。

我们更感兴趣的是大语言模型在垂直行业的应用，尤其在法律、医疗等专业领域的一些应用。

在大语言模型这个赛道中，我们更感兴趣的是能够帮助企业更好地适应大语言模型的平台型或是基础设施类的公司。这是因为，从底层来看，由于数据的持续指数级增长，带来了大量存储和运算的挑战，除了大家关注的AI发展所需要的AI芯片外，我们对数据存储技术、数据库技术以及相应的数据集成也非常感兴趣，尤其软件的基础设施是我们非常感兴趣的。

在整个创投行业对于AI、大语言模型的发展欢欣鼓舞的同时，我们也意识到，VC在选择投资标的时有自己的标准和门槛。

硅谷VC看生成式AI：做AI淘金热“卖水人”，应用层数据壁垒是重点

腾讯科技：在生成式AI中更看好哪些方向？

王金林：美国西部大开发“淘金热”时期，世界各地的掘金者疯狂淘金竞争激烈，而另一群人却依靠卖铲子、卖饮水、卖牛仔裤赚得盆满钵满。

在AI这个领域底层的基础设施中，不光要关注“挖金子”的企业，那些不直接参与竞争，却在AI产业中承担“卖水人、卖牛仔裤”角色的企业也同样有机会，比如算力、AI芯片、边缘计算、内存融合技术、光通讯等等，包括量子计算我们也在关注中。

作为一家VC，我们认为投资生成式AI除了软件之外，基础设施（infrastructure）是非常重要的，其中就包含硬件层的算力、芯片等等。

比如，我们投资了d-Matrix，这是一家专注于AI芯片研发的企业，2023年9月完成了由淡马锡领投的1.1亿美元B轮投资，微软也投资了并且给他们下订单，在我们看来这一领域必将迎来爆发式增长。d-Matrix的产品Corsair，是一款用于人工智能推理的内存计算引擎，能够将人工智能模型完全保存在内存中，这是在未来的AI应用里面重要的新的算力方式。

又如，我们还投资了Analog Computing，这是做AI边缘计算的企业，以后越来越多的AI运算并不需要去数据中心，在本地就能运算。

CPU内存融合基础架构领域也有机会，我们投资了范承工等人创立的MemVerge，这是一家致力于新一代CPU内存融合基础架构（MCI）的公司。在2025年新一代的高速互联技术（CXL）硬件架构面世后，软件层面也将有巨大的飞跃。

反而在应用层面，今天很多市场上大家欢欣鼓舞的AI应用，我们觉得是很难投资的。

VC很难抓住AI应用层的机会，企业的数据壁垒是重点

腾讯科技：我观察到硅谷现在非常关注AI的应用，比如有一些硅谷投资人认为AI在拥有高质量数据的行业中有巨大的应用潜力，就比如医药就是其中一个很有潜力的领域。你们对AI的整体投资逻辑是怎样的？

王金林：诚然，数据为AI投资带来了很多可能性，但实际上早期投资人很难抓到你想投的公司。

大语言模型在某些细分领域，玩家还是比较少的。举个例子，我的一个印度好朋友，他做了一个HealthGPT，一面世就获得了5000万美元融资。

那我关注的问题是，在医疗领域，市场上究竟需要多少个大语言模型？我不认为市场对大模型的数量有很大的需求。因为虽然医疗领域的数据量很大，但是创业者获取了保险、医院的数据，然后训练一个大语言模型，那么这个大语言模型基本上会像OpenAI或是Cohere的API（接口），可能也就是2～3个高级的商业模型或者开源模型。

当然，医疗领域的开源模型可能难以想象，因为很多数据是普通企业难以触达的。在医疗领域，可能真的需要做付费模式（behind pay-wall），而不是开源模式。但是，真正能提供大语言模型的，也就是那么几家公司，因为没必要有太多玩家。

对于我们这些早期投资人来说，就算有的公司我们能够投进去，但很多公司的估值模型对于早期投资来说不匹配。如果实际地说，我们能投资什么样的企业的话，一定是那些比较独特的应用，它拥有独特的优质数据，依赖于其他公司研发的大模型但能够在它独特的数据基础上做好企业服务，这是我们眼中有投资价值的企业。

因此，AI的到来固然让人兴奋，但是对于早期投资人来说，更重要的是什么样的企业、什么样的机会我们能够抓住。

腾讯科技：在您的投资框架中，对于AI投资是怎么划分的？

王金林：最底层是硬件、基础设施，第二层是大语言模型，再往上第三层是工具（比如Copilot）和平台，最上层是垂直应用。

在这四层结构中，除了大语言模型层，我们认为对于小公司来说几乎没有机会之外，对其他三个领域都非常看好。

腾讯科技：在您看来，生成式AI出现之后，你们能够抓住的企业是怎样的画像。比如在AI的模型层，硅谷和国内都有比较一致的意见，就是认为这不是属于风投的机会，因为动辄需要几十亿美金的投入。

目前大家更看重的是生成式AI的应用层。一些国内投资人认为，似乎看不到新的应用场景，很难想象生成式AI将带来怎样的类似移动互联网时代的原生应用；二是对传统行业的改造，进行效率再提升，许多国内投资人认为改造可能会更有机会。不知道硅谷对这个问题怎么看？另外，硅谷似乎不是很看好C端的应用，认为C端应用的壁垒不高。

王金林：C端应用整体来说还是赢家通吃，从过去20年来说这个格局非常明显。而B端，尤其在美国，美国的B端应用有着非常丰富的生态。

对于你刚刚提到的，似乎很难想象生成式AI将带来的新的应用场景，我是同意的。十几年前有个流行的说法叫“ Software is eating the world.（软件正在吞噬世界）”，一开始是互联网化，渐渐地互联网几乎覆盖所有的工作场景（workflow），你所能想到的所有工作场景，几乎都被软件写了一遍，因为软件是通向智能化的唯一途径。

但是到了今天，我们所能看到的比较常见的workflow都已经被软件写了一遍，有的写得好，有的写得一般，只有极少数的垂类还没有被软件覆盖到，但往往尚未覆盖的原因也是因为体量较小。今天我们能看到的大语言模型的应用，包括Chat（聊天机器人）、客服、售前售后，实际上都已经有相应软件提供类似服务，只是服务效果不够好，或者成本较高。

如今，由于技术的更新，我们所能看到的更多是大语言模型、生成式AI改进已有的产品，比如利用大模型对文本、图像、视频的改进。

对于初创公司而言，如果要作为后来人，利用大语言模型把过去已有的应用重新写一遍，只不过成本更低、效率更高，但问题是这个大语言模型又不是公司所拥有的，因此初创公司要成功可能会比较难。反过来，在大语言模型诞生之前，那些在自己的赛道里已经有了技术积累和客户基础的企业，它的优势要远大于一个声称要用大模型做改进型应用的新公司。

我们更乐于见到的是，企业要么有技术壁垒，要么有商业化的壁垒，然后利用大语言模型等新技术对既有产品进行快速迭代。因为底层的大语言模型大家都可以用，大家都能用OpenAI、Cohere的API，所以这已经不是初创公司的壁垒了。而拥有一定客户基础支撑的企业，产品迭代速度会大幅提升。

腾讯科技：所以AI这一波发展对刚成立的初创公司来说，应用层并没有带来想象中那么大的机会。

王金林：在AI这一波应用里，数据一定是重点。如果一家公司有比较独特的数据源，并能够以此做一些应用，这些企业是有一定的壁垒和成长性的。但是完全是对以前的软件的改进，来做一个更好的大语言模型，我觉得是比较单薄的。

所以在AI应用层，我们投资非常具有数据壁垒的应用。当一家初创企业说他要做大模型，那我们的关注点在于，它的数据源从哪里来、算力从哪里来，数据要花多少钱购买，竞争优势在哪里。比如说，一家做新一代AI芯片的公司，我们一定要知道公司技术源头是什么，是有原创的研究还是别的什么，护城河非常重要。

看好电池储能技术及脑科学发展

腾讯科技：2024年，除了AI之外，您比较看好哪些前沿科技的新机会？

王金林：我们覆盖了三个重要的前沿科技领域，基本上沿着AI赛道、可再生能源以及生命科学赛道。

在每个大方向里我们都有非常明确的主题。在以软件为载体的应用层，我们投的基本上是AI应用，比如文远知行是AI在自动驾驶领域的应用，Otter.AI是典型的大语言模型出来之前的机器学习及AI模型，DeepScribe是医疗领域的大语言模型。

在可再生能源领域，我们在电池储能技术领域投了相对比较多的企业。从化石能源转换到清洁能源是不可逆转的历史趋势，当前电力传输的问题已经基本得到了解决，而能源的存储是目前更大的问题。在很长时间内，电池储能技术将持续面临着巨大的需求，而且这样的技术需求日益紧迫。

在这之中，我们更看好电池的阴极材料、阳极材料、电解质、电池材料、电池回收技术等等。在这些上下游领域，我们都投资了许多公司，例如在电池回收领域，我们投资的Ascend Element最新一轮融资后的估值已经达到了15亿美元。

在电池领域，依然有非常多的创业创新，包括新型的电池材料、固态电池、充电性能更好的快充技术、让电池使用寿命更长的技术、提升电池安全系数的技术等等。

腾讯科技：生命医疗领域更关注哪些细分领域？

王金林：在生命科学赛道中，我们非常聚焦在神经科学和脑科学领域，将继续聚焦于AI+医疗的板块。例如，我们投资了优脑银河（Neural Galaxy），对于治疗脑部疾病以及抑郁、失眠等现代人常见的疾病特别有效，他们在中国开了很多诊所，也在2023年进军美国市场。又如，我们所投资的Zeto是一家硬件公司，他们的产品可以较好地接收脑部信号，可以通过AI技术生成脑电图，尽管是初创企业，2023年他们所接到的订单已经让他们实现盈亏平衡。

另外，我们投资的AI项目，还能更好地识别不同的人群，从而让新药开发更具针对性。过去市面上的一些药，对于普通人群效果并不强，但是若能够针对不同人群进行细分，药效会大幅提升。

在脑科学领域，我们投资了基因编辑和基因测序这两个重要方向。我们投资了一个叫Couragene的平台，他们第一个药是治疗天使综合征的，已经获得了NIH（美国国立卫生研究院）4000万美元的投资，正在申请FDA的流程中。

现在许多癌症逐渐变成了可以像慢性病一样被治疗，但是对于脑部疾病以及人衰老带来的各种记忆衰退等疾病，到今天依然缺乏有效的治疗方法。我们认为，经过过去几年的投入，未来五到十年，脑科学领域将有丰硕的成果诞生。

腾讯科技：你们不会把AI当成一个单独的投资领域，而是把AI的应用放在企业软件、生命健康、深科技等垂直行业中看。

王金林：对的。回顾历史，AI的发展总是在高潮、低潮交替中前进。这一波AI的爆发中，我认为大语言模型是非常令人振奋的，会催生很多应用。

接下来，我对于机器人（Robotics）这个赛道非常感兴趣。我们认为Robotics与新一代的computer vision technology（计算机视觉技术）、大语言模型的结合，会催生一些新的应用场景。

我们还是聚焦于特定的比较明确的赛道，而不是说“AI + everything”（AI+万物），就像以前的“互联网+万物”一样。我们在意识到AI的能量之后，还是会深入一些AI赋能的具体赛道中。

未来5—10年，大语言模型有潜力全方位赋能企业

腾讯科技：近几个月以Sora、Kimi等生成式AI掀起了全球新一轮技术创新浪潮。但我们也注意到，美国大公司也频繁发生各种摩擦：比如OpenAI 宫斗、Google 发布Genimi被指责抄袭，硅谷的投资人怎么看待这些大公司频繁产生的争议？

这些争议都和大模型有关系，不同企业对待大模型为最新代表形态的AI前进的方式和路径有不同的方法，看上去Sam Altman、谷歌都还是比较“激进”地推动商业化，硅谷投资人如何看待这种“激进”？

王金林：每一个现象级的颠覆性创新出现的时候，都会产生一些摩擦，风起云涌。这一轮大语言模型的发布，随后一发不可收拾，给全世界都带来了巨大的惊讶与震撼。就在大家都认为硅谷已经失去了创新的动力的时候，大语言模型出现了。

在这个背景下，大公司觉得自己一定不能落后，小公司则焦虑感满满，因为大语言模型对许多小公司的商业模式产生了冲击。作为VC，也要重新思考在这样的颠覆性创新下，如何做投资。

整体而言，对于AI技术有两派意见：一派认为AI非常危险；另一派认为我们离所谓的AGI（通用人工智能）还很远，今天的模型仅仅是预测下个文本，远远不至于造成恐慌。我觉得目前让人恐慌的地方，倒不是说AI已经发展到明天就要接管这个世界了，我们碳基的人马上要被硅基的机器人统治了，并没有看到这样的威胁。但实实在在的就是，今天的AI已经造成了一些困扰，比如错误信息、真假难辨等等，因此我觉得必要的监管是需要的。

作为技术出身的投资人，我认为今天所看到的AI应用还是不够的，我们还有很大的空间来改善大语言模型，还有很大的潜力让所有的企业都能被AI赋能，我认为这是未来5—10年的工作。

当然，技术的发展也需要兼顾安全，目前美国市场还是在一个相对健康的竞争环境下。我相信市场能够找到技术前进与政策规范之间的平衡。但今天的话，如果过早地在这些技术刚开始起步的时候就扼杀掉，是不太符合科技发展规律的。

腾讯科技：整体而言你还是更赞成技术乐观主义这一派。

王金林：对。有一些观点认为对AGI的恐惧，包括这一波AI浪潮技术迭代很快。但是按照我们目前看的公司来看，我认为未来5—10年，我们有一部分工作或多或少会被AI替代或增强。但这些AI Copilot（助手）依然是建立在人的需求之上来提升效率，真正的创新依然来自人类单个的项目。所以我觉得今天读计算机专业的学生大可不必紧张。这可能也体现了我们的一些乐观主义。

文章来源于“腾讯科技”，作者“周小燕”

硅谷VC看生成式AI：做AI淘金热“卖水人”，应用层数据壁垒是重点

关键词: AI , 生成式AI , 人工智能 , D-matrix