图片来源:Snowflake官网
Pat:今天,我们非常高兴地欢迎Sridhar Ramaswamy,Snowflake的CEO。Snowflake是公共市场上最重要的企业公司之一,也是默认的云数据平台。然而,今天有一个重要的问题值得被讨论——Snowflake在人工智能领域将扮演什么角色。Sridhar是我们认识近二十年的朋友,而且实际上他与我们的合作伙伴Bill Corn是在2003年4月的同一天加入谷歌。之后Sridhar创办了自己的初创公司Nieva,这是一款基于AI的搜索引擎。Snowflake收购了Nieva,因此Sridhar成为Frank Slootman的继任者。
我们很少能遇到在技术上如此深入、同时又具备商业洞察力的人,Sridhar正是这样一位领导者。今天,他将与我们分享人工智能对Snowflake的影响、安全网络的重要性、开源社区的作用、竞争格局,以及他作为Snowflake首席执行官在企业中看到的人工智能的实际应用。希望您喜欢今天的讨论。
好的,Sridhar,我们很高兴您今天能够来到这里。您是一位技术专家,曾在消费领域工作了很长时间,现在掌舵着我们这一代最重要的企业公司之一。在我们深入探讨企业人工智能、Snowflake的最新动态以及您对人工智能未来的预测之前,首先能否请您简单介绍一下您的个人背景?此外,虽然了解Snowflake的人可能不多,但为了让我们的对话有些趣味,您能否介绍一下Snowflake是什么?让我们就从这两个话题开始吧。
Sridhar Ramaswamy: 非常感谢您的欢迎。很高兴能来到Sequoia Capital,这里是许多我钦佩的传奇人物的出发地。我是一名计算机科学家,早期的职业生涯中曾从事学术研究。我开玩笑说自己是个“改过自新的学者”,因为我希望能做一些更有影响力的事情。我很幸运能够早期加入Google,参与了人类历史上最伟大的商业之一,即搜索广告业务。我在这个领域工作了近十年,负责Google的所有广告和商业事务,帮助这个业务从15亿美元增长到超过1200亿美元的收入。
后来,我在Sequoia Capital的支持下,创办了一家名为Nieva的雄心勃勃的初创公司,旨在重新思考搜索的含义,直到被Snowflake收购并成为其首席执行官。Snowflake是一个以人工智能为核心的数据云平台。我们的核心理念是,一个以数据为中心的云计算平台,将大大提升企业客户在数据处理方面的效率,这比通用云服务要好得多。我们认为人工智能是一项变革性技术,将改变数据存储、传输以及访问的各个方面。目前,我们拥有超过10,000名客户,去年收入达到6亿美元。总之,我们的核心始终围绕企业和数据展开,这就是我的简要介绍。
Pat:非常好,感谢您的回答。您有大约10,000名客户。我知道您自担任CEO以来,至少与100位客户见过面。
Sridhar Ramaswamy:实际上可能已经接触了数百位客户。
Pat:那么,您对企业人工智能领域的动态肯定有相当清晰的了解,我们的话题就从这里开始吧。您如何看待当前企业人工智能的状况?您在客户中观察到了哪些趋势?
Sridhar Ramaswamy:首先,人们普遍意识到人工智能将带来变革。许多技术在出现时都存在质疑的声音,比如有人曾认为移动技术不会成为主流,或者觉得浏览器太简陋。但人工智能的不同之处在于大家都能清楚地认识到它的潜力。尤其是人们面对ChatGPT时,常常会感到惊叹。无论是请求它写一首诗,还是让它创造一幅图像,任何与之互动过的人都能感受到,这确实是一项非常特别的技术。
人们对人工智能的认识非常高,目前我们有成千上万的客户正在不同阶段实施AI解决方案。这些客户涵盖了广泛的领域,例如一些公司非常期待能够直接为业务用户提供访问业务数据的机会,而不需要经过繁琐的流程,比如必须有分析师、需要BI工具、需要等一周才能进行更改等等。他们的目标很简单,就是希望能够立即将数据交到那些需要它的人手中。
我们也有许多客户将人工智能作为转型引擎来使用。例如,当您处理非结构化数据时,无论是图像还是文字记录,以前需要一个软件工程项目来分析这些图像的内容。而现在,只需将数据输入模型,提出问题,就能获得答案。这样的创新让人们非常兴奋。我们有一款名为Document AI的产品,可以从文档中提取结构化信息,比如合同。我们公司中往往有许多合同存放在文件夹里,里面包含各种关键信息,而理想情况下,我们希望能够对这些信息进行分析。
人们正在实施并投入生产的应用场景非常广泛,从根本上说,核心问题在于如何更有效、更灵活地转换数据,而从更高层面来看,核心问题则是如何以新的、互动的方式让各种业务用户轻松获取数据。这就是人们希望利用数据实现的“夹心层”。
Pat:您能否简要谈谈Snowflake的竞争优势?您提到的一些内容,比如数据转型,确实与Snowflake的核心业务非常贴近,但还有一些可能稍微超出核心范围的应用。例如,如果有人想部署某种企业agent,他们可以使用Snowflake来实现。在这种情况下,Snowflake的竞争优势是什么?能否请您简单阐述一下Snowflake在整个生态系统中的定位以及其竞争优势?
Sridhar Ramaswamy:首先,我们在Snowflake中引入人工智能的基本方法是将其视为一项加速器,以支持您在Snowflake上进行的所有操作。这就是Cortex AI的意义所在,它不仅是一个模型库,远不止于此。Snowflake的厉害之处在于其各个产品功能的紧密集成,这并不是Snowflake的另一个独立服务,而是内嵌于Snowflake之中。这意味着,任何能够访问SQL的分析师都能访问AI,这是一种巨大的民主化机制。
我们早期构建的应用,如Document AI,正是人们希望在Snowflake中利用数据的自然延伸。我们不仅通过像Iceberg这样的互操作存储格式,扩大Snowflake能访问的数据范围,还提供Document AI等功能。我们将以往需要软件工程项目才能实现的一系列AI应用,简化为分析师可以发出的两个命令。因此,我们的首要目标是让AI变得简单,确保在Snowflake中存储的数据能够轻松访问。
当然,有些应用涉及多种服务,可能是尖端技术,但我们给客户带来的角度是,我们提供可靠的AI。这是一个值得深入探讨的话题。例如,对于非专业人员而言,您根本没有理由相信语言模型的原始输出,因为它并不评判真假是非,也不具备权威性。因此,我们会创建一个有依据的对话模型,再次强调,仅需两个命令,而不是一个软件工程项目。类似地,我们的Cortex Analyst API让用户能够轻松与数据进行交互,充分利用我们对架构的全面了解,包括在架构上运行过的所有查询和语义上下文,从而生成一个可靠的应用,其他人可能会在此过程中遇到困难。
我们利用自身在数据领域的优势来提升AI产品的质量。虽然确实会有一些特殊应用需要与GPT4及其他工具的定制集成,但这并不是我们的目标。我们大多数客户的需求在于高效地处理工作,而不是进行AI研究。
Sonia:您是否观察到客户因为使用Snowflake的人工智能服务而将新的数据源引入Snowflake,这些数据在历史上并未存储在Snowflake中?对于尚未在Snowflake中存在的数据,您如何看待自身的竞争优势?
Sridhar Ramaswamy:这是一个涉及面很广的问题。,我在扩展Snowflake的数据视野方面发挥了重要作用。众所周知,Snowflake在很大程度上是一款闭源软件,其代码引擎也是闭源的,类似于搜索引擎。同时,我们还使用了专有的存储格式,将数据导入Snowflake并以此格式保存。然而,从客户那里听到的反馈是,云存储中有100倍或1000倍于Snowflake内的数据。因此,行业趋势越来越倾向于实现数据的互操作性。人们希望他们的数据能够从多个地方访问。
例如,虽然大多数人不希望自己编写定制应用,但一些大型客户希望数据能够存放在云存储中,使得不仅Snowflake可以读取和写入,其他应用程序也能访问这些数据。因此,我们对Iceberg格式进行了大力推广,这是一个互操作的存储格式。我们最近还宣布了云目录的推出。我们的设想是,在未来十年内,数据将主要存放在云中,主要在成本低廉的云存储中,并且以开放目录的互操作格式进行访问。我们认为,这将为Snowflake带来更广泛的数据访问机会。
因此,从数据工程到人工智能,现在都在我们的视野之内。例如,我们有客户正在利用Snowflake的容器服务,在S3中运行视频模型,提取转录内容并将其存入Snowflake。这标志着我们正在扮演一个截然不同的角色。
Sonia:很有道理。那么,对于目前存放在某些超大规模云服务商中的数据来说,您最初提到公司的核心理念是,当基础设施围绕数据处理构建时能够提供更好的服务。那么,您能够以何种方式提供更优质的人工智能服务,而对于那些尚未存放在Snowflake中的数据您希望客户将其引入Snowflake吗?与超大规模云服务商目前所做的相比,这些优势有哪些?
Pat:我能否在此快速补充一点?我们从客户那里听到的反馈是,在这个领域的两端,一方面,客户可以直接与OpenAI合作,将数据发送到他们的云端,但这可能会引发对数据是否会泄露到模型中,以及他们的安全和隐私治理是否得当的担忧。另一方面,客户可以选择完全自建,从Hugging Face上获取模型,自行构建,虽然这样做安全性高,但过程相当繁琐。
而在中间地带,像Amazon Bedrock和Snowflake这样的服务都有各自的价值主张,即兼具两者的优势。我们会使这一过程变得简单,同时确保安全和可靠。因此,我想对Sridhar的提问角度是:对于那些在考虑应该在Snowflake上构建什么与在Bedrock或其他类似云服务上构建什么的客户而言,是什么因素使他们倾向于选择Snowflake?
Sridhar Ramaswamy:客户选择Snowflake的原因在于,我们提供的数据安全性、数据治理和易用性都已开箱即用。Snowflake平台所带来的强大功能,包括协作和其他第三方应用,使得人工智能变得简单明了。事实上,许多人希望将存储在云中的数据或其他应用中的数据引入云存储,重建访问控制列表,并利用定制的向量索引解决方案创建向量索引。接着,他们还需要决定使用哪个模型,无论是API还是自托管的模型,并使用Langchain编写定制的路由逻辑。
然而,我可以肯定地说,99.9%的客户并不会面对这样复杂的流程。现实情况是,他们只想要一个能够在其拥有的100,000份文档上运行的聊天机器人,以取代网站上烦人的FAQ搜索框,提供一个简单有效的解决方案。我们的观点是,客户以前的治理方式能够无缝适用于Snowflake,客户的数据不会流向其他地方,我们保证Snowflake绝不会使用客户的数据来训练任何跨客户模型。此外,我们在整体解决方案的运营成本方面也非常高效和具成本效益。
除此之外Snowflake的魅力还在于我们能够将复杂问题简化。许多客户,例如银行、医疗机构等,最关注的是如何解决问题,而非为了技术而解决技术问题。他们会关注如何更好地建立模型,使模型生成的内容更为准确,如何使其能够正确执行指令,以及如何让它们对不该回答的问题说不。在“与数据对话”这类应用中,我们专注于这些专业领域。而许多客户选择Snowflake的最大原因是,他们能够将一个需要10%的软件工程项目、充满数据和安全风险的任务,转化为分析师仅需花费六小时的工作。我们擅长这一点,也致力于为客户提供这样的服务。
Pat:听起来可以总结为“客户与这些产品交互的层级”。与公有云平台合作时,客户仍然处于基础设施层,需要自行构建许多内容。而在Snowflake,客户处于平台层,许多繁琐的工作已经为您完成。
Sridhar Ramaswamy:我们的长期观点是,生态系统正在向上游发展。曾几何时,我们的父母和祖父母对汽车的每一个部件都十分熟悉,修理化油器、手上沾满机油显得极具男子气概。
Pat:老实说,每次我看到我爸爸准确判断出汽车问题时,我仍然感到十分佩服。
Sridhar Ramaswamy:然而,我必须坦诚,尽管我愿意每天进行力量训练,但修理汽车时手上沾满机油的感觉对我来说已经不再那么吸引人了。因此,绝对可以与云服务提供商合作,比如说我这里有一个模型花园、那里有一个缓存服务、这里还有一个数据库,我会将这些全部连接在一起。对于我们而言,这一切都变成了一个软件工程项目。你可能会觉得,这只是一条简单的数据管道,而实际上,如果你想要一个聊天机器人,这里有一个漂亮的用户界面可供选择。当然,你可以做得更多,但并不是必须的。
Sonia:无论您的客户是在构建Snowflake,是否有某些类型的人工智能应用确实更适合在Snowflake上构建呢?
Sridhar Ramaswamy:人工智能应用的类别自然源于已有的数据。最广泛的用例是通过SQL在交互查询和仪表板中使用Cortex AI,或者在用户运行的作业中使用。这样的应用涵盖了从简单的情感检测(使用一个小模型,实际上并不需要太昂贵的资源)到其他类型的数据提取与操作,比如提取转录文本或临床记录,从中获取结构化数据。
此外,我之前提到的文档人工智能(Document AI)也是一个重要应用,它可以从收据、合同等文档中提取结构化数据。这些正是我们的优势所在。然而,我必须提到的是,即使是那些拥有GPT4和一支庞大软件工程团队的用户,仍然会在诸如“与数据对话”这类应用中面临挑战。尽管GPT4在许多方面表现出色,但其回答的准确率也只有大约45%,即它会错误地回答近一半的问题。而我们在这个领域的准确率已经超过90%,并且正在努力达到99%的可靠性。
显然,我们通过限制应用范围,将这一问题转化为软件工程问题,而不仅仅是AI模型问题。这正是让每位Snowflake客户感兴趣的原因:即使是那些拥有资金和资源投入软件工程团队的公司也会很快意识到,他们可能无法突破这个壁垒。
Sonia:您是如何实现这一点的?能否为我们揭示一下您如何达到90%以上的准确率?您是训练自己的模型,还是采用其他方法?请详细讲讲这一切是如何实现的。
Sridhar Ramaswamy:这是一个系统设计的问题。就像如何让编码助手或更有效的协同工作者在实践中发挥作用的魔力,并不总是依赖于大型模型,而在于仔细地将问题拆解,以便为模型提供正确的上下文。这涉及到一些关键决策,例如,判断回答一个问题的方式与是否回答这个问题是不同的。因此,您可以针对这些不同的子任务专业化,并使用不同的模型。
此外,我称之为“问题定义”的产品结构问题同样重要。我们将Cortex Analyst的产品结构设计得相对更为受限,而不是自由流动的领域。换句话说,schema是复杂的,用户在使用时可能会随意操作,甚至使用一些完全相反的列名。每个公司对“收入”的定义各不相同。如果您将地球上最优秀的模型放在一个任意的模式上,理解其中的细微差别的可能性几乎为零。例如,我们的一些大规模部署中,客户的数据库有200,000张表,可以想象,其中有几万张表包含“收入”这个词,但它们的含义却完全不同。因此,这在我看来真的是一个问题定义的问题。
顺便提一下,这也回归到产品的魔力。任何出色的创始人或产品经理都能够想象出在创建具有广泛适用性的产品时应做出怎样的权衡。这正是我们所做的。我们限制了问题的范围,也明确训练模型,了解何时拒绝回答问题,而不是试图假装能够回答所有问题。显然,这里存在精准度与召回率的权衡。您可以通过不回答任何问题来实现100%的精准度,但这并不是目标。我们希望在保持实用性的同时,依然保持准确性,这需要大量的软件工程工作。
Pat:我想换一个方向谈谈这个话题。最近尤其是在过去六个月时间里,我注意到Snowflake的产品速度似乎有了显著的正向变化。我们曾与许多创始人合作,他们普遍认为,随着公司规模的扩大,产品的迭代速度反而会变得越来越慢。因此,你们是如何实现产品速度正向变化的?毕竟,在Snowflake这样规模的组织中,这并不容易。
Sridhar Ramaswamy:我之前做过很多次类似的事情,经验大致相同。首先,必须确保有一个可以信赖的安全网。例如,建立回归测试,以避免破坏重要功能。但如果推动得足够快,也肯定会产生错误,因此需要区分不同类型的错误。对于一个数据库公司来说,有些错误是灾难性的。例如,如果数据写入错误,你可能需要数月才能恢复过来。因此,你需要理解风险,并为检测潜在问题构建安全网。
如果出现问题,你可以参考Google的做法。例如,我们建立了自动实验扩展框架。基本上,所有新的实验或变更都要经过这个实验框架。该框架会自动运行新变更,在一台机器上观察15分钟,以确保机器不会崩溃,然后再以 0.1%、1%、10%的比例逐步推出,同时进行监测。这样一来,你就能提高速度,因为团队能够设计并推出大量实验。
就像我说的那样,首先是安全网,我们在这方面花了很多时间。其次是内部循环的生产力,即您能多快将单个变更迅速实施。最终,这将决定您能否通过系统实施更多变更。
实际上,Snowflake在我加入之前的两年就开始了一个过程,旨在提高系统的可扩展性。我们为Snowflake的单一统一架构感到自豪,但这可能会成为速度的障碍,因此必须仔细设计如何实现可扩展性。例如,人工智能就充分利用了这一框架。
老实说,领导层在明确重要事项和保持团队间的清晰度方面的关注也至关重要。工作任务几乎是无穷无尽的,而推动这种清晰度以及对 AI 团队的责任感是非常重要的。例如,我会要求每个团队在三个月内做出承诺,同时也要关注接下来两周内的工作进展,并随时调整自己,以确保按时交付。这在我看来,如果想不断进步,就必须说出自己要做的事情,并确保完成所承诺的目标,定期检视并改进。这一系列措施在Snowflake逐步建立。
当然,我强调质量和速度都是我们工作的基本要求。随着团队对完成更多任务的兴趣提升,动力也随之增强。我们没有一个软件工程师会希望“后天”发布,而是希望“今天”就能完成任务。这种积极的心态在发布一系列产品并获得大量客户使用后,会为团队创造正能量,进一步巩固良好的工作习惯。
因此,团队反应非常积极。我告诉他们,这就是人工智能的世界,变化每周都会发生,你需要以这样的速度进行构建。所以我对团队的表现感到非常满意。
Pat: 在人工智能方面,你最为自豪的成就是什么?
Sridhar Ramaswamy: Cortex Analyst是我们设计和推出的最具挑战性的产品。Cortex AI作为平台层也让我感到骄傲,但它更多地属于可预测的基础设施工作。虽然在诸如如何选择VLM、VLLM或其他模型、如何优化推理、以及在当前这个很难获取GPU的疯狂世界中如何获取计算能力等方面有很多技术细节,但在我看来,像Cortex Analyst这样的产品以及文档AI是我们独特优势在新领域的应用,能够为客户带来重大改变。
当然,这有点像“你最喜欢哪个孩子”的问题,所以我很难只挑出一项来。而且,还有很多其他成就,比如我们的云目录Polaris,在短短三个月内完成了开发。因此,团队内部充满了活力。尽管这个信息传播得比较慢,但大家渐渐意识到,可以在同一个问题的不同方面实现速度与质量的平衡。我始终相信,技巧和能力往往优于策略,这是我一生的信念。
Pat:这是什么意思呢?
Sridhar Ramaswamy: 你的执行速度和对情况的反应速度往往会迅速超过一成不变的战略。确实,战略是必要的,但生活从来不是关于不变的战略,因为我们生活在一个非常动态的世界中,很难预测哪款产品会获得广泛成功,或者竞争对手会采取何种行动。比如,我们谈论GPT5时,其发布的时间和影响都是未知的。因此,我非常强调团队需要在行动上迅速。我想传达给团队的就是这一信息。
Pat:在Slootman时代到Sradar时代之间,确实存在着很好的连续性。我知道Frank至少多次引用过彼得·德鲁克的名言:“今天执行良好的计划胜过明天的完美计划。”
Sridhar Ramaswamy: 这完全正确。适应性至关重要。拿破仑有一句著名的名言,大意是“你在进入重要领域时要承认自己无法了解一切,然后要根据实际情况进行调整。”
Sonia: 关于Snowflake在人工智能方面,有哪些误解是您想要澄清的?
Sridhar Ramaswamy: 曾经,Snowflake被认为不太理解人工智能。但早期我们更依赖于合作伙伴战略来推动 AI 的发展。然而,我的一个重要观察是,人工智能是一种平台变革,它改变了我们如何获取软件和应用的方式。一旦我们意识到这一点,便引发了一系列产品的变化:人工智能需要成为Snowflake的核心,我们必须让构建应用变得极其简单,同时也要亲自开发一些最重要的应用。以Cortex Analyst为例,它是一个直接面向业务用户的应用,这在我们之前的工作中是前所未有的。这一切都是基于对人工智能将广泛改变信息消费方式的强烈信念。我为我们拥有一支从基础模型到推理专家,再到整合AI的产品工程师的世界级团队感到自豪。此外,创建AI上层应用的产品工程师也发挥了重要作用。结合Polaris和Iceberg等广泛的数据访问,这使我们处于一个非常有利的位置。
Sonia: 我们能否放大视角,谈谈您对人工智能未来的假设和看法?当然。Snowflake在这个领域处于非常有利的位置。您可能是Nieva上第一个或最早构建LLM原生消费应用的人之一。而现在,作为Snowflake的一员,您能够看到LLM规模竞争的诸多方面。您对此有何看法?我们是否已接近规模的极限?接下来会发生什么?
Sridhar Ramaswamy: 显然,这个话题可以朝几个不同方向展开。我与许多专家交流过,他们普遍认为GPT5 即将面世。但没有人能清楚地预测它将代表什么。TBD Photo的表现非常出色,速度更快,且原生支持多模态,这非常惊人。然而,当涉及到推理能力、制定执行计划的能力时,它并没有给人一种质的飞跃。
尽管agents目前很热门,但在Cortex Analyst出现之前,很多人并不相信可以构建出可靠的数据应用。它们常常隐藏在幕后。要记住,对于业务用户来说,准确率的门槛非常高,比如75%的准确率意味着每四个答案中就有一个是错误的。因此,最大的未知在于这些模型是否能在多步推理等方面实现突破。如果能做到,它们将释放出一种全新的应用类别,这是我们现在无法想象的。
另一方面,在推动广泛采用方面,现有模型仍能发挥巨大作用。每天有许多事情对我们有用,无论是查看邮件还是浏览PDF,想想我们每天都要处理的海量信息。
因此,AI技术的普及将在我们所知的软件中产生巨大的影响,尤其是在用户输入部分。与其他技术不同的是,人工智能已经带来了足够多的改变,将对社会产生有意义的影响,只是需要一段时间才能显现出来。我真诚希望我们不至于进入一个需要10亿美元才能训练出优秀新模型的阶段。虽然这样的模型所能做的确实令人兴奋,但这也会将拥有这种模型的能力限制在极少数人手中,竞争总体上是健康的。因此,做出准确判断非常困难。
Pat:您稍微提到过这个话题,但我想更深入地了解您的看法。如果GPT5延迟推出,或者没有实现显著的进步,或者我们设想一个现状,即当前基础模型的能力就是我们所拥有的,那么关键就在于如何实施、优化和调优这些模型。
我们听到很多AI开发者提到,最初的几周简直是魔法,所有事情都很美好。但接下来的几个月却非常痛苦。比如,“哦,天哪,它处理不了这个特殊情况,也不能解决那个问题,准确性也不够。”人们会感到非常沮丧,有时候他们能通过工程手段解决这些问题,有时候则无能为力。这让人们产生幻灭感,觉得这些技术并没有想象中那么好,甚至会怀疑时机是否合适。
因此,我很想听听您的看法。如果我们冻结当前基础模型的能力,接下来几年企业界会发生怎样的变化?又或者有哪些变化会因为我们还没有准备好而无法看到?
Sridhar Ramaswamy: 对我来说,这实际上就是软件工程的魔力。我觉得我们在使用ChatGPT时,隐含地接受了这一点。人们会觉得,它可以做任何事情,虽然他们并不直接说出来。事实上,他们特意避免这样表述。但就像Google搜索从来不会告诉你“这个查询很愚蠢”一样。想想看,如果它真的这样做,反而会有趣,对吧?但实际上,人们输入的确实有很多愚蠢的查询。
Pat:比如,“哦,我输入了很多愚蠢的查询。”
Sridhar Ramaswamy:就像,“哦,这里有一亿个网页,这是针对您愚蠢查询的最佳页面。”其中有一些确实是传统的AI热情,觉得它可以做任何事情,但同时也有一些是明显的愚蠢,根本不该这么做。对我来说,这就是为什么我们需要让基于事实的聊天机器人成为与信息交互的常态。模型已经存在,这个应用应该告诉你它的信息来源,您应该很容易验证这条信息,并确保您获得的是可靠的内容。
同样,您需要一个测试框架。正如哈里森提到的,应该有一个可观察性框架,持续进行这个工作。但在聊天机器人方面,人们有时会忘记,实际上有一套回归测试的标准。对于我们所有的软件来说,都有接受标准。如果有人要构建一个新的应用程序,比如你们的创始人之一,你的期望是他们整理好思路,并在交给用户之前进行测试。然而在AI的世界里,我们却常常忽视这一点。这些模型对提示中一个句号的添加反应非常敏感。
因此,我们需要意识到,传统的软件保障是必要的,并且需要衡量这些模型的表现。这样一来,项目就不会停留在“爱好”性质的实验上,而是能够真正由软件工程师为您构建。我们认为这是我们带来的核心优势,您应该能够以可预测的方式了解这个聊天机器人或代理应用的成功率,以及Cortex Analyst在您的领域能够为您做些什么,这样您才能放心地部署它。因此,即使GPT5没有出现,依然有许多魔力可以发挥,但这同样需要努力。
Pat:是的。有一句名言我时常引用:“人们错失大多数伟大的机会,因为它们看起来像是在工作。”这就是其中之一,和其他任何事情一样,如果想要出色,就必须付出努力。
Sridhar Ramaswamy: 正是如此。在我看来,这也是我们需要将召回率视为一种调优的因素,将召回率作为思考这些应用的重要部分。任何一个合格的机器学习工程师都会告诉你,“好吧,我有一个AUC曲线给你。”他们想表达的是,模型的表现与其被压榨的程度之间存在权衡,没有完美的平衡。这正是AUC曲线所代表的意义。越是将AI应用视为具有AUC曲线的模型,我们就越能意识到在可靠性和响应能力之间存在权衡。这是一个需要认真考虑的因素,有助于我们思考它们可以创造的价值。
Sonia:我想回到您之前提到的推理这一点,以及它在推动GPT5、Claude等下一次重大飞跃中的作用。似乎大多数人的方法是将搜索引入推理过程,这需要更多的推理计算,并采用类似AlphaGo的搜索策略。我很好奇,考虑到您是世界上最优秀的搜索专家之一,您认为这是否是推动这些通用模型推理能力提升的有效研究路径?
Sridhar Ramaswamy: 我确实能理解搜索在这些模型运作中的作用,但能否详细说明一下?
Sonia:例如,在AlphaGo的案例中,当你试图决定下一步该怎么走时,可以创建一个分支树,列出所有可能的走法,并在此基础上进行搜索,以确定接下来该走哪一步。人们试图将这种逻辑从游戏领域引入到其他领域,比如德文的认知模型,在那里,他们有效地搜索不同的编码选择。因此,在推理过程中,赋予模型搜索可能路径的能力,以帮助决策,这就是我想说的。
Sridhar Ramaswamy: 确实,有许多论文探讨了这种方法。比如,欧洲的研究也有关于在领域中进行搜索的论文。这些研究的核心在于,在制定计划的过程中,如何对不同的选择进行评估。然而,很重要的一点是,这些方法通常依赖于神经网络模型能够有效地评估某个状态空间中的特定点。以AlphaGo为例,它对什么是有利位置有很好的理解,因此搜索是基于这些判断来引导的。
但在面对开放性问题时,当您产生搜索空间的备选方案时,是否能有效评估这些选项就不那么明确了。确实,这些技术在结构化的游戏环境中效果很好,因为你可以了解最优解的含义,并朝着它进行优化。
以烹饪为例,看似简单,但如果考虑十种食材和二十个步骤,每个步骤都有多种选择,你很快就会遇到组合很复杂的问题。然而,实际上只有一到三种完美的食谱。因此,如何衡量认知能力的跃升在这里就变得复杂。在结构化环境中很容易进行分析,但在真实世界中进行复杂操作时,这就变得更具挑战性。
我们已经构建了类似于代理分析师的原型,但它仍然是一个结构化的空间。比如,我过去二十年来,每天都会收到一封关于公司前一天业绩的邮件。这让我想起了我十岁时为父亲管理家庭财务的经历。每隔几周,我们会发现某个地方的收益下降,某个可怜的分析师需要钻研各种数据,寻找问题所在。最终,他们会得出结论,比如“澳大利亚是复活节,德国是复活节,巴西是升天节”,这就是我们数据异常的原因。
经过十年的努力,我们逐渐将这些复杂因素建模成预测模型,逐步形成了一定的预测能力。但这种分析实际上是受限的。通常,我们会对某个指标进行分析,尝试从十个不同的维度切分数据,以确定问题的可能来源。
我们确实构建了AI分析师的原型,能够消除60%到70%的问题诊断工作。这是一个相对自由的形式,但如果您能够告知语言模型您的属性,并调用Cortex Analyst获取输出,然后查看结果并告诉我下一步该做什么,这样您就可以开始自动化一些过程,使其更具实用性。
然而,对于更开放性的问题,例如“这里有 100 个不同的不可比拟的选择,如何进行评估和筛选”,我仍然没有好的直觉倾向。
Sonia:我想从另一个角度讨论搜索。如果可以的话,您在谷歌和Nieva的经历使您对搜索有了独特的见解。目前,消费者界对新一代搜索引擎的出现充满期待和紧张。我很想听听您对当前AI搜索领域的看法。
Pat:您对Perplexity有什么独到的见解吗?
Sridhar Ramaswamy: 我为Perplexity感到高兴。这再次提醒我们,时机和地点的重要性。在Nieva,我们对搜索的理解与Perplexity非常相似,但我们当时早了两三年,时机真的决定了一切。你可以把Perplexity看作是我们处理信息的一种消费体现。
现实就是,没人愿意花时间只为找到其中两行自己真正关心的内容而去浏览一份八页的文档。因此,从这个意义方面来讲,Perplexity确实在正确的方向上。更重要的问题是,搜索业务在商业合同的保护下,往往与消费者的选择无关。我们往往习惯直接接受现成的事物,因此使用浏览器默认的搜索引擎。虽然我们可能会抵抗,但总体来看,这就是现实。因此,这才是更大的挑战,因为搜索市场主要被少数几家控制入口的公司所垄断。根本问题在于,打破搜索业务的壁垒非常困难,消费者通常不喜欢改变自己的使用习惯。
Pat: 这也涉及到当前AI领域的一个更广泛的问题,即incumbents(既有企业)与创业公司的竞争。历史上,争论的焦点在于:既有企业能否凭借其分销渠道开发出优秀的产品,还是创业公司能够开发出优秀的产品并建立分销渠道。搜索就是一个很好的例子。即便你的产品再优秀,改变消费者的行为依然非常困难。AI在这方面是一个有趣的案例,因为许多优秀的产品功能通过开源或第三方模型都可以获得。因此,这似乎形成了一种既有企业相较于创业公司更具优势的局面。你对此有何看法?
Sridhar Ramaswamy:从两个不同的视角来看这个问题。首先,关于模型,开源模型加上像Meta这样预算几乎无限的参与者,他们愿意开源模型。,除非你有一个附属的超大规模公司或业务,否则从零开始创建模型将非常困难。因此,我希望这不会导致世界只拥有几种类似GPT5的模型,因为这对整个世界来说是个坏结局。所以我确实认为,缺乏强大商业支撑的基础模型公司能够成为产品,但OpenAI创建了一个相当可靠的产品,它不仅仅是一个基础模型。
对于你提到的破坏与创新的问题,我会从历史的角度来回答。每一代硅谷公司都是从前一代公司中学习而来的。它们更聪明,知道哪些方面可能被颠覆,并会大力投入。我们都知道,比如说IBM的中型计算机的颠覆,以及DEC和SGI等公司如何被微软所颠覆,之后又是网络的兴起导致了Google和移动公司的崛起。
在每一次这些转型中,资金雄厚的强大incumbents展现了更早、更快介入的能力。例如,当我在谷歌时,我们非常重视家庭助手的开发,因为我们认为Alexa将会统治世界,这将是你我以及其他人搜索的主要方式。我们非常恐惧,并投入了大量资金,但最终没有取得任何成果。这并不重要,为什么呢?因为颠覆的成本远高于你所需的投资额。
可以说,现在是第五代或者类似的阶段,所有的incumbents都非常清楚哪些东西可能会被颠覆,并开始主动应对。AI本质上是对企业软件的重新洗牌。某种程度上,我觉得snowflake不会引领AI发展的潮流。尽管不是在等待发展,但你会看到每一家企业AI公司都以同样的方式积极参与。因此,关于AI在消费软件中将驱动多大的颠覆,这让我产生了疑问。
当然,将会出现新的类别。如果我是创业者,我会对创建一个新类别感到更有信心。例如,大规模生成图像的技术显然令人惊叹,但视频和语音也是如此。在这里可以进行多种专业化,适应市场需求。
在AI领域,新事物似乎是一个更安全的选择,而不是选择一种“我可以更快地做XYZ,因为我使用了AI”。这种方式并没有太大的前景。
Sonia:你认为ChatGPT有机会成为下一个谷歌吗?关于消费者选择只是幻影这一点,以及商业交易是如何锁定这些东西的,我很好奇我们对苹果与ChatGPT之间的合作协议的看法。
Sridhar Ramaswamy:ChatGPT在某种程度上有可能成为下一个Google。手机是一个很有趣的领域,因为它是一个受控环境,实际上为消费者提供了巨大的潜力。比如说,复制一个地址,从日历或电子邮件中粘贴到Uber中,这听起来很简单,但实际上却非常困难。我总觉得城市应该提供这样的功能:复制Pat邮件中的地址,粘贴到Uber上,以便我能叫到车。
在我看来,日常应用中有巨大的潜力。由于移动生态系统相对封闭,苹果可以要求开发者提供APIs,以便使用语言模型访问他们的功能,否则可能无法获得流量。这对所有人来说都是一个很好的激励,促使他们朝这个方向努力。因此,这里有很大的潜力。
我真希望这个领域能有更多的创新,因为所有这些技术都是完全可以实现的。我们可以争论是否应该在云端完成,或者能否在手机上实现。但作为消费者,你在乎这些吗?只要这个应用能正常工作,我就乐意使用。我觉得这些都是细节问题。
我实际上认为ChatGPT是一个惊人的产品,它的基础技术非常出色,而且在许多方面创造了令人惊叹的用户体验。它让像我这样视觉上不太敏感的人变成了初学艺术家。我常说,我善于表达,可以整天说话或写作,而 ChatGPT带来的魔力真的很惊人。
例如,我最近在学习印地语,某个时候我遇到了一些数字方面的困难。于是我提出一个请求,希望得到一个将数字翻译成印地语的CSV文件。结果只需10秒,我就下载了文件并导入到Quizlet中,这样我就能快速做测验。以前我使用Python脚本处理结构化数据的事情,现在只需用英语输入,上传CSV文件,就能实现加列、格式化等操作,真是太神奇了。
因此,在产品和商业层面上,ChatGPT绝对是一个优秀的选择。但要成为搜索引擎的王者,这还需要更多的努力和资源。
Pat:好的,接下来我们进行几个快速问答。你最欣赏哪位AI领域的人物?
Sridhar Ramaswamy:我最欣赏那些在有限资源下努力工作的基础模型研究人员。例如,像Arthur和Danny这样的人,他们在资源有限的情况下取得了令人瞩目的成就。Danny Yogotama来自Reka,他们取得了很多杰出的成果。还有我们团队的成员,比如Samia和Manyushang。对我来说,他们展现了极大的创造力。我经常告诉他们预算有限,问他们能做什么。我欣赏那些在紧张条件下推动研究的真诚人们。当然,很多人都很出色,但我特别喜欢那些真正做事的人,他们在想象我们的未来。
Sonia:你最喜欢的AI应用是什么?
Sridhar Ramaswamy:ChatGPT4,毫无疑问。它给我的日常生活带来了非常显著的实用性。
Sonia:后续你希望会有什么AI应用?
Sridhar Ramaswamy:我希望有一个可以与手机对话、能够在各个应用之间进行调解的助手。这将非常酷。正如我之前提到的,在不同应用之间切换做一些小事情是如此麻烦。
Pat:最后,我们以一个乐观的问题结束。未来五到十年,AI领域最美好的事情是什么?你最期待看到什么?
Sridhar Ramaswamy:AI能够作为一种工具,帮助我们编码思维、捕捉在现实世界中行动的能力,过去50多年中这一点已经改变了许多事物。对我来说,AI作为软件创建和使用的工具,让世界上更多人能够获得这些能力,将是一个重要的进步。正如我所说,这并不一定需要很多复杂的新技术,尽管新技术可以促进新类型的应用。我曾非常自豪地将Google搜索通过Android的技术,带给地球上几乎每一个人。这是一项真正的技术进步,对人类的发展至关重要。AI模型作为人类与软件之间的新层次,实际上使得这些功能对更多人变得更加可及。无论是在创作方面,还是在消费方面,这是一个非常值得期待的事情。
Pat:太好了,谢谢你,Sridhar。感谢你参加这个访谈。
Sridhar Ramaswamy:谢谢你,Pat。谢谢你,Sonia。谢谢你们。
文章来自于“Z Potentials”,作者“Jie Sun”。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/