图片来源:a16z
Troy Kirwin:90年代是关于互联网上的文本的,2000s是关于图像的,2010s是关于视频的。我们非常强烈地认为,2020s将是关于交互式3D和游戏技术在企业中的应用。游戏本质上是虚拟模拟,而虚拟模拟在过去的几十年里一直是为了好玩而设计的。但是,我们将越来越多地看到它们在现实世界中的各种用例,无论是培训、学习和发展,还是用于机器人和其他自主系统的训练场,亦或是可视化,来让人们实时看到的事物变得栩栩如生。
a16z:Troy 你好,你觉得今日有什么可能被大家忽视的事情吗?今天每个人都引用GPU作为一个例子。
Troy Kirwin:人们都忘记了英伟达是一家游戏公司。几乎所有早期收入都是用于游戏显卡、计算处理单元和矩阵乘法,这些都非常适合渲染图像、动画和视频。但我们很快发现它对加密货币挖掘等事情很有用。
a16z:现在感觉一切都像数字生物学一样,就像这种加速计算的想法,现在正在被使用。
Troy Kirwin:我回头看了一些NVIDIA最早的网站,标题是未来是3D。然而25年后,相较其他行业而言,3D发展速度比人们希望的要慢,这太有趣了。我们将谈一谈为什么我们认为现在是合适的时机。90年代是关于互联网上的文本的,2000s是关于图像的。2010s是关于视频的。我们非常强烈地认为,2020s将是关于交互式3D和游戏技术在企业中的应用的。
a16z:为什么游戏或游戏行业以及从中衍生的技术会成为创新的熔炉?
Troy Kirwin:Jensen自己说过,他允许消费者的支出用于研发,使其成为今天的样子。我认为这是思考游戏技术的一个有趣的视角。在游戏行业,技术创新备受推崇。新技术,无论是新平台、新功能还是进化,都使得新游戏设计得以出现和繁荣。游戏社区,包括玩家和开发者的心态是一种黑客心态,因此过去已经出现了重大突破并不奇怪,而且我们将看到它们继续出现。
a16z:是的,其中一些突破性进展并不显而易见。一个很好的例子是多人游戏,对吧?多人游戏在游戏中一直存在,然后过了一段时间才真正渗透到游戏中,或者说公司是基于多人游戏的想法建立起来的,比如Figma。关于这一点,今天在游戏行业,仍有许多创新正在发生,也许在十年左右的时间里,我们将在其他地方看到这些创新。所以让我们来谈谈那些风口趋势,伟大想法中的三个。
Troy Kirwin:是的,你知道,在a16z之前,我在Unity工作了将近五年,近距离观察到了看到各个行业开始尝试实时3D技术,来处理我之前谈到的任务,无论是建筑师能够在设计建造之前进行可视化,来可以看到是否有错误或其他类型的不完美,这些他们愿意在设计阶段发现的问题。对于自动驾驶汽车制造商来说,他们也使用实时3D技术进行设计、虚拟试驾,Rivian由Unreal驱动,BMW是由Unity驱动的,包括重型机械操作等其他类型的操作任务虚拟培训。许多用例的一些瓶颈实际上与游戏开发者内容创建所面临的游戏相同。超过一半的支出用于创建这些虚拟模拟中的资产、艺术和内容。对于这些非游戏的用例也是如此,除了他们没有3D艺术家员工来构建它们。所以现在,当我们拥有用于资产生成的AI时,无论是图像、音频还是现在的3D资产,游戏创新都使这变得更加容易。如上是其一。第二个是3D捕捉技术。因此,对于许多非游戏用例,他们希望捕捉物理世界的构建和外观。
a16z:去获得一个某种意义上“正确”的版本?
Troy Kirwin:是的。过去有些技术允许这样做,比如摄影测量,或者Matterport基本只是一个360度的图像,但缺少与视频游戏一样与环境互动。现在有了更新的技术,比如几年前的神经辐射场的Nerf,或者近年的辐射场技术,比如Gaussian Splatting技术,可以让消费者以更有效的方式捕捉到逼真、栩栩如生的照片。
a16z:而且它是即时的,就动捕而言。
Troy Kirwin:是的。第三个是针对一些非游戏用例的,这就是我们将看到XR的流行,并能够戴上耳机,看看BIM模型如何覆盖在建筑现场上,或者用于医疗手术模拟,以及其他类似的用例。它们使用更好、更轻的耳机,有了眼动追踪和其他惊人的技术。在发展方面还有很多要做,但我认为其中一些将被解锁。
a16z:3D内容创建、动作捕捉技术以及设备这三个风口,感觉每个都有自己的成本曲线。是否可以谈谈成本曲线等经济方面的内容?50%的成本用于内容创作,这个比例下降的速率有多快?
Troy Kirwin:对于设备,特别是对于这些非游戏用例,其中一些是照片是真实的。这是随着虚幻引擎和其他3D引擎朝着逼真的方向发展中,这些用例已经被解锁的原因。但对于其他用例,你并不真正关心BIM模型看起来像什么样子,它对你有用即可。因此,随着其中一些资产类别达到他们期望的标准,成本就会急剧下降。更重要的我认为是虚拟培训用例,比如我们想对我们的员工进行机器人维护和维修方面的培训,你应该提供资金,建立这种基于虚拟模拟的体验。但是事后,如果团队想要更新或添加内容,他们必须回到构建它们的外包机构,即最初的数字孪生体。现在他们在内部自己做这件事。
a16z:所以这不仅仅是一对一的,创造一件东西的经济学,而是要考虑它们变化的规律,以及它是如何整合到整个系统中的?这很有趣,让我们谈谈应用程序。你提到了几家非常不同的公司,比如Anduril、特斯拉和宝马,然后你还谈到了员工培训,比如告诉我更多关于这些应用的信息,它们的终点在哪里,还是我们真的到处都能看到它?
Troy Kirwin:自主性深深植根于这些虚拟模拟,Anduril是一个很好的例子,它第一次收购是一家游戏工作室,这对于一家国防技术公司来说将是令人惊讶的。
a16z:我想如果你拿Palmer的过去举例。
Troy Kirwin:是的,他们有兴趣为该工作室开发的游戏引擎获取它,并将该技术用于策略模拟和其他自治工作流。考虑其他公司应用直觉,在现实世界中捕捉训练数据的规模是不切实际的。因此当你有这些虚拟仿真,不仅可以扩展数据量,还可以扩展那些你在现实世界中永远无法体验或捕捉到的边缘和情况,无论是极端天气还是人为干预,这些千分之一的情况,但为了部署需要考虑的。
a16z:关于应用直觉的一种说法是,你实际上可以做一些以前无法做到的新事物。能否有第二、三阶效应大规模模拟的下游应用机会可以从这些虚拟环境中获得?
Troy Kirwin:在过去,我们有能力将这些虚拟模拟用于我们谈到的物理培训环境或学习和劳动力发展,但这些大多是其他物理模拟或硬技能,但现在有了游戏环境中称之为AI NPCs,此前是脚本化的,但现在这些agent可以承担自己的生活,他们可以观察环境,进行推理和规划。多智能体模拟可能应用于下一次大流行应对或移民政策以及这些政策如何影响我们正在发展的文明,来采取良好行动。我们将在虚拟环境中测试这些agent之间的交互。
a16z:你提到的许多应用程序都更加注重企业,像特斯拉游戏这样的公司显然已经开始在消费者领域存在。更多的消费者应用程序也即将到来吗?
Troy Kirwin:一个我刚刚非常兴奋的是,我刚刚搬进了一间新公寓,想规划空间,尽管我们有Sims,可以在3D环境中拖放家具,看看它们是否合适,但我仍然使用网格纸和笔。今天存在的所有技术都是为了以惊人的直观方式获得这种体验。我们可以扫描我们的空间和开发3D环境的数字孪生体,我们应该能够展示从Pinterest上找到的设计灵感,让它找到最匹配我的灵感的家具或艺术品填补现场,然后要么能够在虚拟世界中穿行,要么使用增强现实,看看它如何适应你的空间和你的尺度。有点像3D Wayfair,最终消费者有一个逼真的数字孪生可视化空间。
a16z:到2025年为止,我们主要谈论的是过去几十年发明的技术,但显然这波真正令人兴奋的新技术浪潮在应用方面并没有真正找到立足点。你有注意与游戏有什么交点吗?
Troy Kirwin:HMI领域(ZP注:人机交互,Human Machine Interaction)正在进行一些非常有趣的研究和工作。可以想象各种不同的用例,但与大多数新兴技术一样,公司使用的依旧是初级游戏使用案例,利用消费者支出来资助他们的研发,类似于英伟达。很明显,Apple Vision pro在眼动追踪方面取得了巨大进步。但我们将看到BCI型技术,它从你的大脑读取能量信号,以在虚拟环境中控制和与计算机交互。所以可以考虑VR用例,可以严格使用我的脑电波与场景交互。我们也已经看到技术可以通过在手指上戴戒指来进行感官或数字触摸,从而增加对虚拟世界的沉浸感。这有点像每个游戏玩家的梦想,能够完全沉浸在触觉反馈中,不仅在游戏控制器中,而且在你的整个身体中。
原视频:Virtual Worlds Mean Real Business: How Games Power the Future
https://www.youtube.com/watch?v=y19hzwTGIss
编译:Liisa Zhang
文章来微信公众号“Z Potentials”,作者“a16z”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md