一年前,红杉资本将2024年定义为AI的"原始混沌期",这个判断为业界广泛认可。最近,他们又发布了对2025年AI产业的预测。作为一家顶级投资机构,红杉的每一个预判都值得重视。
然而,在仔细研读后,我发现这份报告虽然洞见深刻,但在某些关键判断上可能存在偏差。为此,我完整翻译了这份报告,并在每个重要节点都附上了自己的观察和思考。让我们一起来看看,2025年的AI图景到底会是什么样子。
2024 年,AI 处于原始混沌状态。2025 年,AI 的根基逐渐稳固。
去年一月,我们把 ChatGPT 比作 AI 发展史上的"大爆炸",并预测 2024 年将是 AI 的"原始混沌期"。当时的 AI 生态系统充满创新理念和潜在动力,是创业者的黄金时期。我们曾写道:"尽管充满可能性,但一切仍然模糊不清,需要远见卓识将这些可能性转化为实实在在的、最终具有影响力的成果。"
时至今日,AI 生态系统已经逐渐成形。大模型竞赛中已经诞生了五个"最终竞争者"。Nvidia 万众期待的 Blackwell 芯片即将在本月面世。2024 年初规划的众多数据中心正在全力建设中。台积电正在扩建新的晶圆产能,Broadcom 也在开发定制 AI 芯片:整个供应链已经全速启动。从医疗到法律再到保险领域,各行各业都在启动新的 AI 项目。
如果说 2024 年是 AI 的混沌期,那么现在其基础架构已经基本成型。AI 的潜力正在变成看得见摸得着的现实——体现在从宾夕法尼亚州 Salem 到德克萨斯州 Round Rock,再到威斯康星州 Mount Pleasant,遍布美国各地正在崛起的实体数据中心。如果说 2024 年是创意迸发的一年,那么 2025 年将是检验这些创意是否真正可行的一年。
以下部分为译者注
红杉将2024年定义为"混沌期"的说法值得商榷。实际上,2023年才是真正的混沌期:那时全球涌现出数不胜数的大模型研发公司,算力奇缺导致一卡难求,中国更是掀起了轰轰烈烈的"百模大战"。
相比之下,2024年反而呈现出明显的"出清"迹象——美国市场已经收敛到五个"最终竞争者",中国市场也逐渐聚焦于"AI六小龙"。这种从"百家争鸣"到"优胜劣汰"的转变,恰恰说明行业正在走向成熟。与其说2024年是混沌期,不如说它是AI行业进入理性发展阶段的开端。【译注结束】
2024 年,大模型竞赛的核心目标是达到 GPT-4 的水平。五家公司实现或接近实现这一目标,成为"最终竞争者":Microsoft/OpenAI、Amazon/Anthropic、Google、Meta 和 xAI。其他公司,特别是 Inflection、Adept 和 Character,已退出竞争。
为达到 GPT-4 的水平,这些公司采用了相似的策略:尽可能多地收集数据,使用最多的 GPU 进行训练,优化预训练/后训练架构以提升性能。2024 年人才在各公司间频繁流动,使得几乎没有什么技术秘密可言。
当各家公司准备下一轮 LLM 扩展时——预计将是现有计算规模的 10 倍——这些 AI 实验室正在培养各自独特的核心优势。可以说,他们已为即将到来的竞争"选定了各自的武器"。在 2025 年,这些不同的策略将导致不同的结果,一些公司会脱颖而出,而另一些则可能落后。
- Google – 垂直整合:进入 2025 年,Google 的优势在于全产业链整合。Google 是唯一拥有自主研发的一流芯片的公司:其 TPU 在 2025 年有望与 NVIDIA GPU 展开竞争。Google 还建设自己的数据中心,训练自己的模型,并拥有强大的内部研究团队。与选择合作伙伴的 Microsoft (OpenAI) 和 Amazon (Anthropic) 不同,Google 通过掌控整个价值链来争取胜利。
- OpenAI – 品牌优势:根据多项调查,在 ChatGPT、Claude 和 Gemini 的品牌认知度方面,差距相当明显。OpenAI 毫无疑问拥有 AI 领域最强大的品牌。这帮助其成为大型 AI 公司中收入最高的公司,据报超过 36 亿美元。如果 AI 的成功最终取决于消费者认知度和企业端推广能力,OpenAI 可能会进一步扩大与竞争对手的差距。
- Anthropic – 人才优势:2024 年,大量研究人才从 OpenAI 转投 Anthropic。随着 Jon Schulman、Durk Kingma 和 Jan Leike 等重量级人物的加入,Anthropic 在研究领域的影响力显著提升。公司还引入了包括 Instagram 联合创始人 Mike Kreiger (担任首席产品官) 在内的重要高管。在 GPT-3 发明者 Dario Amodei 的带领下,Anthropic 已成为 AI 科学家的首选去处。
- xAI – 数据中心建设优势:正如我们在"钢铁、服务器和电力"一文中所述,数据中心建设是 AI 竞争下一阶段的关键。xAI 以创纪录的速度部署了拥有 10 万个 GPU 的 Colossus 集群,成为数据中心扩张的行业标杆。xAI 与竞争对手的下一个目标是建设 20 万,进而是 30 万 GPU 集群。如果"规模决定一切"的说法成立,xAI 将很可能保持其快速发展的势头。
- Meta – 开源优势:Meta 在 Instagram、WhatsApp 和 Facebook 上已经具备强大的分发优势,现在又全力押注开源战略。Meta 是主要竞争者中唯一采取这种路线的公司。Meta 的 Llama 模型拥有大量忠实用户,而关于开源与闭源的讨论仍在持续。如果前沿技术发展开始放缓,Meta 将因其开源模型而占据优势,能够快速普及这些技术能力。
在大模型竞争中,严格的执行力至关重要。竞争格局和各参与者的战略定位已经明确。2025 年,我们将见证哪些策略是富有远见的,哪些最终会证明是错误的选择。
以下部分为译者注
红杉的"五强"格局预测过于美国中心化,也过于乐观。
首先,全球AI竞争版图远比这个更加复杂。在中国市场,已经形成了以智谱GLM、MINIMAX、月之暗面、百川智能、零一万物、阶跃星辰为代表的"AI六小龙"阵营,以及百度文心、阿里通义、腾讯混元、讯飞星火、华为盘古为代表的大厂阵营,它们在本土应用场景和数据优势上具有独特优势。
欧洲市场则有Mistral AI异军突起,其在开源领域的影响力正在全球范围内快速扩大。
更重要的是,2025年的竞争格局很可能会进一步收缩。即便是现在的"五强"或"六小龙",也不是所有玩家都能笑到最后。原因有三:
1. 算力压力持续上升:尽管各家在扩建算力,但顶级模型的训练成本仍在快速增长。以GPT-5的传闻规模为例,可能需要的算力投入将让一些玩家望而却步。
2. 商业变现困境:目前大多数大模型公司仍处于烧钱阶段,现金储备的差异将在2025年凸显。没有找到好的商业模式的玩家可能被迫退出竞争,就像2024年的Inflection一样。
3. 技术代差拉大:随着前沿玩家在特定领域(如多模态、智能体等)的突破,技术差距可能会进一步扩大。跟不上创新步伐的公司可能会被市场淘汰。
具体来看,各大玩家在2025年可能呈现如下态势:
北美市场:
- OpenAI:其优势在2024年已被其他竞争对手迅速追平甚至超越,部分功能甚至出现抄袭Anthropic的情况。加之大量顶级人才流失,创始团队几乎解体,2025年可能从引领者转变为追随者角色。
- Anthropic:不仅获得了大量顶尖人才加盟,产品能力已经超越OpenAI。Computer Use等创新功能的推出展现了强大的研发实力和创新能力。
- xAI:2024年完成基础设施布局后,在2025年可能会以马斯克标志性的颠覆式创新姿态重新定义行业标准。
中国市场:
- 智谱、MINIMAX、阿里通义可能继续保持领先地位
- 月之暗面、百川智能、零一万物在2024年已出现资金、团队等问题的负面传闻(有真有假),产品迭代减缓,或将逐渐掉队
- 字节跳动、腾讯这两家沉睡的巨头开始觉醒,凭借其强大的技术积累和商业化能力,可能在2025年异军突起
因此,预计到2025年底,全球范围内真正具有竞争力的大模型公司可能会进一步减少到5-6家,它们很可能是:
- 北美:Microsoft/OpenAI(重点是商业化)和Anthropic(重点是安全)
- 中国:可能只有2-3家能够在算力和资金的双重压力下生存
- 欧洲:Mistral AI可能会通过开源路线保持竞争力
- 潜在黑马:或许会有1-2家现在不起眼的公司通过特定垂直领域的突破异军突起 【译注结束】
2.AI 搜索正在成为杀手级应用——并将在 2025 年广泛普及
自 ChatGPT 问世以来,业界一直在寻找 AI 的杀手级应用场景。哪些新的用户习惯能够经受住时间的考验?
2024 年,从 AI 虚拟伴侣到 AI 租房助手,再到语音助手和 AI 会计,市场上测试了各种各样的应用。
我们认为,AI 搜索将成为 2025 年最广泛普及的应用之一。Perplexity 自推出以来发展迅猛,月活用户已达 1000 万。OpenAI 在 10 月推出了 ChatGPT Search,进一步扩展了其搜索功能。《华尔街日报》最近刊文称"用谷歌搜索是老年人的习惯"。讽刺的是,这个挑战恰好出现在 Google 陷入反垄断诉讼之际。
AI 搜索是对传统互联网搜索这一杀手级应用的革命性重塑。传统互联网搜索主要是基于网页索引的导航工具,而 AI 搜索则是基于 LLM 的信息工具,能够阅读和理解知识的语义。这对白领工作者来说将是一个巨大的效率提升。
AI 搜索可能会打破目前一统天下的搜索市场格局。未来可能每个行业都有自己的专业 AI 搜索引擎——分析师和投资者使用 Perplexity,律师使用 Harvey,医生使用 OpenEvidence。同样的逻辑下,Midjourney 可以看作是面向"图像世界"的搜索引擎,Github Copilot 是面向"代码世界"的搜索引擎,Glean 则是面向"文档世界"的搜索引擎。与传统搜索相比,AI 搜索能够进行更深层的语义理解,因此效能提升了一个数量级,带来显著的生产力提升。
作为产品界面的文本响应比表面看起来要复杂得多。不同的文本响应有着不同的特点。我们认为 LLM 能够在多个维度上实现真正的产品差异化,创业者可以围绕这些特点,为特定用户群打造独特的产品体验:
- 意图理解:通过专业领域定制,可以更准确地匹配用户需求。比如,医生和患者问同一个问题时,需要看到不同类型的答案。
- 专业数据库:在专业领域,独特的数据资源至关重要,如律师需要的判例法、分析师需要的财务数据、保险公司需要的天气数据等。在商业环境中,准确性是基本要求。
- 呈现格式:包括回答的详略程度、是否使用要点列表、是否包含多媒体内容、是否注明来源等。例如,会计师和记者对信息的接收方式就很不相同。
- 界面设计:代码搜索要整合到 IDE 中,会计政策搜索要嵌入会计软件中。语义搜索需要考虑用户的工作流程和数据环境。不同领域需要不同的界面设计。
新一代专业领域 AI 搜索引擎将尽可能贴近目标用户的"思维模式"。医生、律师和会计师的思维方式各不相同。当我们成为某个领域的专家时,我们获取知识和决策的方式就开始分化。医生需要研究医学文献,律师需要研究判例法,投资者需要分析财报。每个领域解析、分析信息和做出决策的方式都不尽相同。
AI 搜索很可能会在消费者市场和企业市场形成分化。作为消费者,我们的需求大致相同,这就是为什么 ChatGPT 能获得巨大成功。但作为专业人士,我们的需求各不相同。可以预见,每个知识工作者每天至少会使用两个 AI 搜索引擎——一个用于工作,另一个用于生活中的其他方面。
以下部分为译者注
我对红杉把AI搜索视为下一个杀手级应用的判断持保留意见。从2024年的市场表现来看,AI搜索似乎主要在北美市场有较强需求,全球市场反响平平。OpenAI的Search产品昙花一现,中国市场的秘塔等产品也鲜有声量。相反,2024年实际涌现了其他更具潜力的应用方向。
最引人注目的是AI编程已经成为首个超级APP。Cursor凭借其强大的代码生成和实时协助功能迅速成为开发者首选工具,而Windsurf更是将AI编程体验推向了新高度,其创新的交互方式和精准的代码理解能力获得了开发者的一致好评。这些产品不仅显著提升了编程效率,更重要的是它们已经形成了明确的商业模式和变现路径。这种成功验证了AI在专业领域的变现潜力。
同时,AI图片与视频领域在2024年呈现爆发式增长。中国企业在这个领域表现尤为亮眼,比如字节跳动成功解决了中文字体嵌入的技术难题,快手可灵、海螺AI等产品更是在全球市场获得广泛好评。这个领域的技术迭代速度惊人,产品体验持续提升,用户基数快速扩大。
更值得关注的是多模态创意工具的崛起。以即梦/剪映为代表的产品融合了AI图片、视频、音频、剪辑等多种功能,不仅打通了普通用户的使用门槛,还重新定义了内容创作的可能性。这类综合性工具很可能成为2025年真正的杀手级应用,而不是单一的搜索功能。它们将重塑内容创作的范式,降低创作门槛,释放普通用户的创造力。传统的搜索需求可能会被这些更智能、更全面的工具所部分替代。【译注结束】
我们此前讨论过 AI 的 2000 亿美元和 6000 亿美元问题,分析了大科技公司的巨额资本投入,以及终端用户收入不足以覆盖这些投资的困境。
2024 年初,大科技公司担心 AI 可能威胁其在云计算业务中的寡头地位。正如我们在"AI 资本支出的博弈论"一文中所述,这些公司别无选择,只能积极投资以确保在 AI 时代保持领先地位。如果他们不投资,其他公司会投资,他们就会落后。
进入 2025 年,形势发生了显著变化。大科技公司已经牢牢把握住 AI 革命的主导权。他们不仅控制着支撑 AI 的绝大多数数据中心,还在主要 AI 模型公司中持有重要股份,同时也是新兴 AI 创业公司的最大投资者。
随着大科技公司信心增强,我们预计 2025 年 AI 领域的资本支出将趋于稳定。如果说 2024 年是争抢土地和电力资源的一年,那么 2025 年将是项目落地的一年。建设工作已经开始,这些公司将专注于按时按预算完成新项目。之后,他们需要向客户推广这些新增产能,并帮助企业客户充分利用新的 AI 能力。
自 ChatGPT 出现前至今,资本支出已增长近一倍,预计 2025 年将逐步回归常态。第三季度的最新资本支出数据显示,Microsoft 和 Google 的投资已趋于平稳。Amazon 和 Meta 仍在加大投入,但可能在 2025 年初达到稳定水平。(虽然 Meta 在数据中看似平稳,但公司已预告第四季度将增加资本支出)。
寡头垄断的市场格局也将逐渐形成。各大科技公司都在密切关注竞争对手的动向。如果行业开始步入"新常态",这对所有参与者都是好消息。这将有助于 2025 年市场达到新的平衡,而不是继续无序扩张。
随着 2025 年新数据中心投入使用,AI 计算成本有望继续大幅下降。这对创业公司来说是个好消息,将刺激新的创新。如我们之前所说,创业公司主要是计算资源的消费者而非生产者,因此从过度建设中受益。大科技公司实际上正在创造一个惠及整个 AI 生态系统的补贴效应。
人们经常把云计算比作镀金时代的铁路垄断。如果说数据中心是数字经济的铁轨,那么到 2025 年底,新的 AI 基础设施将全面就位。关键问题是:这些"铁轨"上将运载什么"货物",我们如何利用这项新技术为客户和终端用户创造价值。
让我们期待在这一年里,借助 AI 的基础设施,创造出改变人们生活的令人惊叹的新能力。
以下部分为译者注
这个预测非常理性,但可能低估了几个关键因素的影响。首先是地缘政治因素,在科技竞争日益激烈的背景下,各国政府可能会加大对AI的投入,从而推高整体投资规模。特别是美国进一步收紧对华出口管制的背景下,中国国内的算力供给将面临更大的不确定性,这可能导致国内企业不得不加大在基础设施方面的投入。
其次,大模型的发展规律正在经历重要转变。随着Scaling Law逐步从训练阶段走向推理阶段,所需要的算力可能会进一步攀升。这意味着即便是已经建成的数据中心,其算力配置可能还需要持续升级,以满足日益增长的推理需求。
此外,虽然大型科技公司的基础设施支出可能趋稳,但在垂直领域,特别是在医疗、金融等关键行业,AI相关投资可能才刚刚开始加速。投资重心将从基础设施逐步转向应用场景,这种转变值得关注。2025年可能会看到更多传统行业巨头开始大规模部署AI解决方案,推动新一轮的投资热潮。
因此,2025年的整体投资态势可能会呈现"基础设施投资相对平稳,但应用层面投资加速"的特点,同时受地缘政治影响,不同地区的投资节奏可能会出现明显分化。【译注结束】
参考:https://www.sequoiacap.com/article/ai-in-2025/
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。
项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file