VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

9248点击 2026-07-02 18:17

一边是已经跑进生产管线的 Tripo，一边是指向可交互世界的 Project Eden，产业资本下注两条线的交汇。

极客公园获悉，VAST 本月再次完成超 10 亿元人民币 A3 战略轮融资。一个月之前，这家公司刚刚披露完成约 2 亿美元融资，并正式披露世界模型项目 Project Eden。

连续融资当然是一个重要信号。但这一轮更值得关注的，不只是金额，还有投资方的构成。

在新一轮融资里，产业资本的存在感进一步增强：包括吉利资本等头部产业方，四三九九、贪玩游戏、巨人网络等游戏厂商，某知名互联网战投都参与其中。此外还有亦庄国投、基石资本、毅达资本、成都科创投、复星创富、华控基金、锡创投、慕华科创、策源资本等一线投资机构及地方产业基金联合参投，老股东渶策资本、元生资本继续追投。

汽车、游戏、互联网、地方产业基金同时出现，并不是偶然。对这些产业方来说，AI 3D 大模型和世界模型正在从一个前沿技术方向，变成一项和内容生产、空间计算、工业设计、智能制造相关的底层能力。

过去两年，多模态大模型的主流叙事大多围绕文本、图片和视频展开。相比之下，3D 生成看起来没有那么大众化，也不如图片、视频生成容易在公众中传播。但在游戏、XR、3D 打印、汽车座舱和工业设计等产业场景里，真正昂贵、稀缺、难以规模化的，往往正是可以被编辑、被交互、被放进生产流程里的 3D 资产。

这也是 VAST 试图切入的位置。

如果说 AI 视频解决的是「生成一段画面」，AI 3D 要解决的则是「生成一个可交互的数字对象」。前者更容易被用户感知，后者则是产业链里重要的生产资料。

这也解释了为什么这一轮会有更多产业资本进入。他们关注的并不只是一个 AI 生成工具，更多还在于 AI 开始理解、生产和推演三维世界之后，可能带来的内容生产、空间计算、智能制造和下一代交互平台的变化。

从生成 3D 模型，到进入生产管线

VAST 的发展路径，远远突破了一开始外界的想象空间。

公司成立于 2023 年，最早切入的是 AI 3D 大模型。这个选择看起来不如语言大模型、视频生成热闹，但对游戏、动画、XR、3D 打印、工业设计等行业来说，3D 资产一直是最昂贵、最耗时、也最难规模化的生产环节之一。

VAST 旗下核心产品 Tripo，定位就是提升 3D 内容生产效率。

一开始，AI 3D 更像一个「把图片变成立体模型」的工具。它能生成模型，但距离真正进入专业生产管线使用还有距离。很多 AI 生成的 3D 模型看起来不错，却面数很高，布线混乱，UV 难以展开，进入游戏引擎或 DCC 工具后仍需要大量人工修整。

这也是 AI 3D 过去很难真正进入产业的原因：它可以很好看，但不一定能进生产管线。而 VAST 过去几年的重点就是解决这个挑战。

今年 3 月，VAST 发布 Tripo P1.0。它可以在 2 秒内直接输出拓扑干净、可进入游戏引擎的网格模型。简单说，过去 AI 生成的是「看起来像」的模型，现在它开始尝试生成「真的能用」的模型。

VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

VAST CTO 梁鼎在采访中提到，P 系列的重要变化在于，它不再只是生成百万面高模，而是能把面数降下来，同时尽量保持精度和布线质量。这意味着很多资产不再必须经历「高模生成—人工重拓扑—低模修整」的漫长过程，转而有机会直接作为游戏资产进入生产流程。

当然，这并不意味着 AI 3D 已经完全替代专业美术。

梁鼎也强调，不同行业对「可用」的定义并不一样。手游、PC 游戏、主机游戏、3A 游戏、三消游戏，对模型精度、布线、动画、贴图的要求差别很大。有些资产可以直接用，有些仍需要人工调整。

但变化已经很明确：AI 3D 正在从「生成效果」走向「生产工具」。

在 VAST 的能力演进里，3D 资产可以被拆成「皮、肉、骨、脑」几层：视觉效果是皮，拓扑结构是肉，绑定和动画是骨，资产自身具备行为逻辑、能与玩家和环境交互，才是脑。P1.0 主要解决的是「肉」的问题；后续迭代会继续提升四边形面、对称性、重拓扑、面数上限和布线质量。

这些能力恰恰是 AI 进入真实产业流程的关键。

落地更快的生成式 AI

今天很多 AI 应用还停留在效率工具或内容辅助阶段，真正进入产业工作流并不容易。

但 AI 3D 是一个例外，背后的逻辑很简单：3D 资产很重要，也很贵。过去高度依赖专业人员和复杂软件，生产周期长、成本高。AI 3D 如果能压缩其中一部分环节，就不是锦上添花，更能够直接改变生产效率。

游戏是最典型的场景。

对中小团队来说，AI 3D 可以弥补「创意大于产能」的问题。很多独立游戏团队不缺想法，缺的是足够多的美术资源。过去需要几十人美术团队才能填满的世界，未来可能通过 AI 3D 以更低成本搭出来。而对中大型游戏公司来说，AI 3D 也可以接入美术中台，成为不同项目组共享的生产能力。

今天在游戏领域，AI 3D 可能并不会「一键生成完整游戏」，但已经逐步嵌入已有生产流程，缩短资产制作、概念验证和宣发素材制作的周期。

在游戏之外，VAST 的落地场景也在不断拓宽。

3D 打印需要把想法变成可打印模型，XR、空间计算和 AI 眼镜需要大量能被放进真实空间的 3D 内容，汽车行业则在工业设计和座舱交互上开始与 AI 3D 结合——新能源汽车迭代速度越来越快，外观、内饰和车机体验都需要更高频地验证，AI 3D 可以帮助设计师更快看到不同方案的空间效果，也可以为车机助手、数字人、个性化 3D 内容提供更好的用户体验。

从游戏到 3D 打印，从 XR 到汽车，这些行业差异很大，但底层需求相似：它们都需要大量低成本、高质量、可编辑、可进入流程的 3D 内容。

这也是 AI 3D 今天能比很多 AI 应用更快落地的原因。它不仅仅是一个「更炫」的内容生成工具，更是在补工业数字化生产里长期存在的一块短板：如何低成本、高效率地把现实世界里的物体、空间和设计想法，变成数字世界里可使用的资产。

但这件事的潜力并不止于提升生产效率。

在 VAST 的判断里，3D 不是游戏美术的一个细分方向，而是物理世界更原生的表达方式。现实世界本身是三维的，视频里的二维像素，只是三维世界被压缩之后的投影。要让 AI 真正理解物理世界，只让它看图片和视频还不够，更重要的是让它理解物体的结构、空间关系、尺度和位置。

换句话说，AI 3D 生成资产的过程，某种意义上也是让 AI 理解物理世界的过程。

VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

生成一个椅子，不只是生成一个「像椅子」的外观，而是在理解它的几何结构、部件关系和可编辑形态；生成一个房间，也不只是生成一张室内效果图，而是在理解桌子、墙面、灯光、通道之间的空间组织方式。过去，这些信息需要大量人工建模、标注和整理，几乎不可能靠人力规模化完成。

从这个角度看，VAST 过去做 3D 资产生成，并不只是为了服务今天的游戏或工业客户。它同时也在积累一套更底层的能力：把物理世界里的对象和空间，转化成 AI 可以处理、生成和推演的结构化数据。

这也是为什么 VAST 会继续往世界模型方向走的原因。

世界模型，打开的是更长期的想象力

世界模型正在成为 AI 产业里最热的关键词之一。

过去，大模型主要在回答两个问题：AI 如何理解语言，如何生成图片和视频。但随着机器人、自动驾驶、空间计算和互动娱乐继续升温，行业开始关注一个更底层的问题：AI 能不能理解一个持续运行的物理世界？

对机器人来说，它需要在真实环境中理解空间、预测动作后果，并做出决策；对自动驾驶来说，它需要在复杂道路环境里理解动态变化；对游戏和互动内容来说，它需要生成一个可以被玩家进入、操作、可多人共享的世界；对数字孪生和工业仿真来说，它需要的不只是一个静态模型，而是一个能够持续演化的系统。

这也是 VAST 开始布局世界模型的背景。VAST 从去年下半年开始探索世界模型。一方面是行业机会出现，另一方面也和公司成立之初的愿景有关——VAST 一直希望做低门槛的互动内容平台，而世界模型可能是实现这一愿景的一条路径。

VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

但 VAST 对世界模型的理解，并不完全等同于当下更常被讨论的具身智能路线。

具身智能更关心机器人如何理解环境、做出决策，很多时候只需要处理短时间的状态变化。而 VAST 目前更明确走的是互动娱乐方向，因此它更在意三件事：实时可交互、多人同时在线，以及长时间、大空间的一致性和记忆。

简单说，一个可交互世界不能只是不断生成下一帧画面。玩家离开一个房间再回来，房间里的东西还要在；一个用户改变了环境，其他用户进入时也要能看到同样的结果。这要求系统有一套独立于画面的底层状态，而不是把所有记忆都压缩在视频帧里。

这也是 VAST 发布 Project Eden 的意义。相比不少以动作视频生成或静态 3D 场景生成为主的路线，Project Eden 更强调把底层世界状态与视觉渲染解耦：底层维护世界状态、记忆和推演，中间层把状态转化成语义或画面条件，最后再生成用户看到的视觉画面。它想解决的不是「更好的视频生成」，而是让一个生成世界真正持续运行。

VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

而能做到这一点，也在于 VAST 过去的积累。

世界模型需要的并不只是视频数据，而是视频背后的空间结构：物体在哪里、相机如何移动、动作之后状态如何变化。VAST 过去长期做 3D 基础模型，意味着它更有机会从互联网视频中提取深度、相机位姿、几何轨迹等结构化信号；同时，也可以利用游戏引擎中天然存在的「内部状态 + 渲染输出」来生成训练数据。

正因如此，世界模型在 VAST 这里并不与具身智能画等号。它可以为具身智能提供数据和环境，比如构建机器人训练场景、生成仿真环境、提供物理一致的世界状态。但具身只是世界模型能力可服务的一个应用方向，和游戏、XR、汽车、数字孪生并列。

VAST 再获超 10 亿元融资：当 3D 生产力遇上世界模型想象力

某种程度上，AI 3D 让 VAST 有了当前的商业化入口，而世界模型给了它更长期的技术延展空间。

从生成一个 3D 资产，到生成一组可编辑资产、搭建 3D 场景，再到生成一个可交互、可被记忆、可多人进入的世界，VAST 试图走通的是一条层层递进的技术路径。它的每一层都有对应的产业落地场景，也因此不必等到终局才产生商业价值。

这或许才是产业资本在这一轮集中进入的原因。他们下注的，不是一个 AI 工具，而是 AI 从二维内容生成走向三维世界理解、生产和推演时，可能出现的新基础设施。

*头图来源：VAST

文章来自于微信公众号 “极客公园”，作者 “极客公园”

关键词: AI新闻 , VAST , AI 3D , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI房屋装修

【开源免费】scribble-diffusion是一个将AI草图变成家装设计方案的AI项目。该项目功能已经在家装设计领域广泛使用。
项目地址：https://github.com/replicate/scribble-diffusion?tab=readme-ov-file
在线使用：https://scribblediffusion.com/

【开源免费】roomGPT是一个室内装修的AI项目。上传房屋图片，即可将房间重新装修一遍，变成梦中情房。
项目地址：https://github.com/Nutlope/roomGPT
在线使用：https://www.roomgpt.io/（付费）

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目，该项目可以帮你实现“线上线下的数字人销售员”，
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址：https://github.com/xszyou/Fay

AI 3D建模

【开源免费】LGM是一个AI建模的项目，它可以将你上传的平面图片，变成一个3D的模型。
项目地址：https://github.com/3DTopia/LGM?tab=readme-ov-file
在线使用：https://replicate.com/camenduru/lgm

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales