Windsurf:如何构建企业级 AI IDE(两万字)

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Windsurf:如何构建企业级 AI IDE(两万字)
3627点击    2025-01-14 09:52
  • 本文背景:

最近需要整理一些 AI IDE 的资料,读了好几篇海外独角兽的文章,对 cursor 的访谈那篇印象深刻,但我个人更喜欢用 windsurf,作为对比,我找来了 windsurf 的访谈,时间是2024 年 12 月 14 日,正好满一个月,希望对大家有用!


  • 本文翻译:

claude 3.5,如有错漏,敬请谅解!


  • 本文来源:

文章: https://www.latent.space/p/windsurf 

视频: https://www.youtube.com/watch?v=VcUl0vPJwxo


  • 本文目录:
  • Latent Space 开场白
  • 企业战略:慢下来以加速前进
  • 介绍与近况交流
  • 他们为什么创建了 Windsurf
  • VS Code 的局限性
  • Cascade 和 Windsurf 的评估方法
  • 听众关于帆板运动启动的问题
  • 远程执行和安全问题
  • Codeium 策略的演变
  • Cascade 及其功能
  • 多智能体系统
  • Windsurf 的改进领域
  • 打造一家以企业为先的公司
  • Copilot for X、AI 用户体验和企业 AI 博客文章


Windsurf:如何构建企业级 AI IDE(两万字)

Windsurf:如何构建企业级 AI IDE(两万字)


Agent Coding 的未来、构建无聊的企业集成以及增长到 100 万用户


01.

 Latent Space 开场白


感谢 Sarah、Pranav、Peter、Isaac、Vik、Loubna、Sophia、Eugene、Dan、Paige、Luca、Nathan、Graham、Dylan 和 Jon,以及我们出色的志愿者团队和赞助商,最后但同样重要的是,感谢 2,200 位在线上和线下加入我们的你们!


自从我们录制这一集以来已经过去几周了,所以 Anshul 录制了一个"发布后的疯狂"回顾,包含了一些经验教训和更新。听完这一集后,请务必在 YouTube 上查看。


我们 2023 年 3 月的第二位播客嘉宾是 Codeium 的首席执行官 Varun Mohan;当时,他们有大约 10,000 名用户,并承诺永远保持自动完成功能免费:


他们决定将核心自动补全功能免费提供(而 Copilot 每月收费 10 美元)不仅仅是为了竞争,更是对 AI 开发工具中价值最终将被捕获的领域的一种押注:主动式代码生成。


我们很幸运地连续收到了来自 Anshul 的三篇热门文章,讲述了他们关于构建 Codeium 的思考,从转型到独角兽创业公司的全过程:


  • 第一部分:如何选择长期人工智能产品策略
  • 第二部分:如何让你的人工智能产品与众不同
  • 第三部分:如何通过你的 AI 产品赚钱


如今,超过一百万开发者使用他们的产品,他们仍然保留免费套餐,并且最近推出了 Windsurf,一个人工智能集成开发环境,它获得了非常好的评价,更重要的是,通过了 Latent Space Discord 的氛围检验。


Windsurf:如何构建企业级 AI IDE(两万字)


虽然 Cursor 选择了 fork VS Code(我们在 Cursor 专题中讨论过这一点),但 Codeium 最初专注于跨 IDE 兼容性。他们支持 Eclipse、JetBrains 等,这使他们在企业环境中具有巨大优势。


他们现在正在超越文本编辑,转向代理工作流程,并且他们正在使用自己的集成开发环境 Windsurf 来实现这一目标。他们将其核心理念围绕"Cascade"流程展开,这不仅允许模型自动完成一行代码,还能以与工程师相同的流程对多个文件进行多步编辑。


在后端,现在有多个模型为你做出决策:


  • 针对低延迟击键级特性和代码生成的自定义模型
  • 用于大型代码库的高质量检索的专有系统
  • 第三方高级规划模型


所有这些都由定制基础设施提供支持,使他们能够支持其他公司没有的功能,如填充中间内容。他们现在正在迅速推出新一波功能,以在新的 Windsurf 体验基础上进行构建。


02.

 企业战略:慢下来以加速前进


与许多初创公司不同,后者往往急于以最少的功能进入市场,之后再添加企业级功能,Codeium 从一开始就在企业级基础设施上进行了大量投资。这种"慢即是快"的方法在 AI 工具领域已被证明特别有价值。


当我们去拜访一家拥有数万名开发人员的企业时,他们会问:"你们的基础设施能否支持数万名开发人员?"我们可以转过身来说:"嗯,我们在个人计划中已经为数十万名开发人员提供服务了。"


他们早期不得不投资的一些"无聊"的事情:


  • 从一开始就构建容器化系统,以使本地部署和 VPC 部署更加简便
  • 尽早投资安全和合规
  • 即使在早期可能有些过度,也保持了在模型推理和分布式系统等关键领域的核心竞争力
  • Varun 提到他们交谈的财富 500 强公司中,不到 10%完全使用 Github。这迫使他们支持多个版本控制平台和系统,如 GitLab、Bitbucket、Perforce、CVS、Mercurial 等。


他们做出的另一个选择是,创始人没有立即雇佣传统的企业销售人员,而是亲自向 30-40 位客户进行销售,以了解其中的动态。这种亲身经历塑造了他们对人工智能工具企业销售所需要的看法:


  1. 技术深度:与传统的企业软件不同,AI 工具销售需要深入的技术理解,因为这些工具之间的差异相当微妙。外行人可能会认为 Github Copilot、Cursor 和 Codeium 都是同一回事。
  2. 部署工程:借鉴 Palantir 的模式,Codeium 雇用了与销售团队密切合作的部署工程师。这些技术专家不仅帮助客户进行部署,还能带回大量无法从 X 或 Discord 获得的产品反馈。
  3. 持续学习:"我们的技术正在飞速变化...购买我们技术的人对 RAG 很感兴趣,对吧?想象一下,如果我们有一个正在扩张的销售团队,但没有人了解这些东西。我们就无法成为客户的优秀合作伙伴。"


他们最初采用永久免费模式,然后增加了每月 10 美元的专业版计划,之后涨到每月 15 美元,后来又增加了每月 60 美元的升级版。然后还有常见的"企业版计划",价格根据具体情况而定。


如果你是一位在人工智能领域创业的创始人,这一集节目深入探讨了如何思考模型和产品的边界,以及如何在拥挤的市场中构建有效的营销策略。


03.

 介绍与近况交流


大家好,欢迎收听 Latent Space 播客。我是 Alessio,Decibel Partners 的合伙人兼首席技术官,和我一起主持的是 Smol AI 的创始人 Swyx。


嗨,今天我们很高兴成为,我认为是第一个在新的 Codeium 办公室录制的播客。所以感谢你们邀请我们,欢迎 Varun 和 Anshul。


Windsurf:如何构建企业级 AI IDE(两万字)


Windsurf:如何构建企业级 AI IDE(两万字)


Varun : 谢谢邀请我们。


Swyx : 这是硅谷办公室吗?那么,这背后有什么故事呢?


Varun : 故事是这样的,我们的办公室以前在 Castro 街上,就在 Mountain View。我想公司里很多人以前是 NSF 的,或者现在仍然是 NSF 的。实际上,如果你注意到的话,公司离 Caltrain 只有两分钟的步行距离。我们不想把办公室搬得离 Caltrain 太远,那可能会惹恼很多住在旧金山的人,包括我在内。所以我们在附近寻找了很多地方。然后这个地方出现了。之前它被 Facebook 或者说 WhatsApp 租用,紧接着是 Ghost Autonomy。现在轮到我们了。房东还告诉我们,这里是《硅谷》所有外景镜头的拍摄地。这就成了一个梗。相信我,这不是我们选择这里的主要原因。但我们确实顺势而为了。


04.

 他们为什么创建了 Windsurf


Swyx : 这并不会造成伤害。是的。显然这也在一定程度上影响了你们推出 Windsurf 的过程。好的,让我们来了解一下近况。你是第四位嘉宾。我想可能是第二位。可能是第二位。可能确实是第二位。自那以后发生了很多事情。你们筹集了一大笔资金,并且刚刚推出了你们的想法。自从 Latent Space 的人上次见到你以来,在过去一年左右的时间里,你们取得了哪些进展?


Varun 是的。我认为发生的最大变化是 Codeium 的扩展继续获得了很多人气。你知道,我们有超过 80 万开发者使用该产品。很多大型企业也在使用。我们最近获得了摩根大通的创新奖,这通常不是一家公司在部署企业产品一年内就能获得的。像 Dell 这样的大公司也在使用该产品。所以我认为我们在企业领域看到了很大的吸引力。但我认为我们最近推出的最令人兴奋的事情是这个名为 Windsurf 的 IDE。对我们来说,我们一直在思考的一件事是如何为各地的开发者构建最强大的 AI 系统?我们之所以从扩展系统开始,是因为我们觉得有很多开发者不会只使用一个平台。顺便说一下,这仍然是事实。在硅谷之外,很多人不使用 GitHub。这是一个非常令人惊讶的发现。但大多数人使用 GitLab、Bitbucket、Garrett、Perverse、CVS、Harvest、Mercurial。我可以继续列举,但可能有 10 个左右。GitHub 在财富 500 强企业中的完全渗透率可能不到 10%。非常小。此外,GitHub 对源代码管理工具的切换成本非常高。对,对,对,对,对,对,对。所有依赖于这个工作流软件的系统。这比切换数据库还要困难。因此,我们实际上找到了无论客户从哪里开始他们的源代码,我们都可以成为更好的合作伙伴的方法。然后更具体地说,在 IDE 类别中,很多开发者,令人惊讶的是,不仅仅编写 TypeScript 和 Python。对吧?他们编写 Java。他们编写 Golang。他们编写很多不同的语言。 然后高质量的语言服务器和调试器就变得很重要。说实话,JetBrains 拥有最好的 Java 调试器。这一点毋庸置疑。对吧?这些都是极其复杂的软件。我们有些客户中超过 70%的开发者使用 JetBrains。正因如此,我们想要在开发者所处的任何地方提供出色的体验。但我们发现一个缺失的地方是,你知道,我们在 VS Code 生态系统和 VS Code 平台上构建时遇到了局限性。我们认为有机会构建一个顶级的体验。而且这在团队的能力范围之内。对吧?团队已经完成了所有工作,所有基础设施工作,以构建最佳的体验。对吧?并将其插入每个 IDE。为什么我们不直接构建自己的 IDE 呢?对吧?对。对。因为这无疑是最好的体验。随着这些智能产品变得越来越可能,以及我们在检索和代码库推理方面所做的所有研究越来越成熟,我们就想,嘿,如果我们在一个我们没有太多控制权的系统上推出这个智能产品,它只会限制产品的价值,我们就无法构建最好的工具。这就是为什么我们非常兴奋地推出 Windsurf。我确实认为它目前是功能最强大的 IDE 系统。对吧?而这仅仅是个开始。我们认为还有更多可以做的,不仅仅是自动完成这一方面。对吧?当我们最初讨论时,可能自动完成是产品唯一的功能。而我们从那时起已经走了很长一段路。对吧?从那时起我们已经走了很长一段路。这些系统现在可以在不需要你添加所有内容的情况下推理大型代码库。就像你使用 Google 时,你会说像在 New York Times 发布,巴拉巴拉,然后问一个问题吗?不会。 我们希望它成为一种神奇的体验,你不需要做那些事情。我们希望它能真正地去执行代码。我们认为代码执行是一个非常非常重要的部分。当你编写软件时,你不再仅仅是想出一个想法,软件创建的方式是软件最初是一个无定形的 blob。随着时间的推移,当你有了一个想法,blob 和云就会消失,你会看到一座山。我们希望的情况是,一旦你看到这座山,AI 就会帮助你到达山顶。一旦你看到这座山,AI 就会为你创造这座山。对吧?这就是为什么我们不相信那种你只是写一个任务,它就去执行的模式。对吧?这对于从零到一的应用程序来说是好的。我认为人们已经看到 Windsurf 能够做到这一点。我会让 Anshul 谈谈这个。但我们在真正的软件开发中看到了真正的价值,这更多地是说,这并不是说当前的工具做不到。但我认为更多的是在实际上从一个非常基本的想法演变代码的过程中。代码的构建并不是你有一个 PRD 然后得到一些输出。它更像是你有一个总体愿景。是的,当你编写代码时,你会越来越清楚哪些方法不行,哪些方法可行。你不断地否定一些想法,同时创造新的想法。我们认为 Windsurf 是这种情况的正确范式。


05.

 VS Code 的局限性


Alessio : 你能具体说明一下吗?什么?你在 VS Code 中无法做到什么?因为我记得当我们做 Cursor 那一集时解释过,然后 AgriNews 上的每个人都在说,哦,为什么你们要 fork ?为什么?你们本可以通过扩展来实现。你能不能再详细解释一下这些限制?


Anshul : 我的意思是,我认为关于 API 的许多限制都已经有很好的文档记录。我不知道我们是否有必要深入探讨这个问题。我想当我们开始思考,我们实际上需要给 AI 哪些部分来达到我们要讨论的那种"涌现行为"时,是的,我们谈论了我们一直在为企业构建的所有知识检索系统。显然,那是其中的一个组成部分。你知道,我们讨论了我们可以给它访问权限的所有不同工具,这样它们就可以进行那种终端执行之类的操作。但我们意识到的第三个主要类别,就是那种神奇的东西,你不用写 PRD,不用为 AI 界定问题范围,而是如果我们实际上能够理解开发人员在编辑器中所做的轨迹,对吧,如果我们实际上能够看到,哦,开发人员刚刚打开了 API,查看了目录的这个部分,然后他们做了这些编辑,并试图在终端中执行某些命令。如果我们真的理解这个轨迹,那么 AI 就能立即理解你的意图,这就是你想做的事情,而不需要你把所有细节都说出来。这就是那种魔法真正发生的地方。我认为这就是那种直觉。所以你有那些有详细文档记录的 API 限制。我们有这样的愿景,即我们实际上需要连接什么来真正展现这一点。我认为正是这两者的结合,我们才意识到是时候做编辑器了。编辑器并不是一个全新的想法。我认为我们已经讨论编辑器很长时间了。 我认为就像是,当然,我们只是在过去几个月里把它全部整合在一起。但它一直是心里想着的事情。只有当我们开始意识到,好吧,这些模型无法做到这一点时。我们实际上可以查看这些数据。就像我们有一个非常好的上下文感知系统。我们想,我认为现在是时候了。然后我们就开始执行了。

Alessio : 所以基本上实际上并不是你不能做的一个动作,而是你如何把所有这些都整合在一起。


Varun : 这就像 VSCode 某种程度上是一个沙盒,或者让我更深入地探讨一下 Anshul 提到的每个方面。我们先谈谈 API 方面。现在,我给你一个例子。Super complete 实际上是一个我认为非常令人兴奋的产品特性。对吧。它可以建议对代码进行重构。我认为你可以在 VSCode 上快速而强大地完成这个。实际上,我们的问题并不是无法实现这个功能。我们已经有这个功能一段时间了。问题实际上是即使要展示这个功能,VSCode 也不会为我们提供 API 来做这个。所以我们最终做的是动态生成 PNG 来展示这个。这并不是真正对齐的。我们最终自己做了,花了几个小时来实现这个。对吧。这并不是因为我们是糟糕的工程师。不,我们优秀的工程时间被用来对抗系统,而不是成为一个好系统。另一个例子是我们需要找到重构代码的方法。VSCode 的 API 会不断地在我们这里崩溃。我们不得不不断地展示越来越糟糕的体验。这实际上涉及到 Anshul 提到的第二点,就是我们可以做出伟大的工作和研究。我们这里所有的工作并不是像 Cascade 的研究那样只是几个月的事情。这是我们作为一个公司已经调查了九个月到一年的事情。投资于评估,对吧?即使是这方面的评估也需要很多努力,对吧?实际上需要很多系统工作来完成。但最终,这需要成为开发者实际使用的产品。我认为,你知道,让我们以 Cascade 为例,比如说看看它的轨迹。


Swyx : 是的,我们想看看 Cascade,因为这是你第一次提到它。对。


Varun : 所以 Cascade 是产品中实际具有代理能力的部分,对吧?它能够从人类轨迹和 AI 轨迹中获取信息,了解人类最终做了什么,AI 最终做了什么,然后提出变更并实际执行代码,最终为你得到最终的工作输出,对吧?我甚至可以谈一些非常基础的东西。Cascade 给你提供一堆代码。我们希望开发者能够非常容易地审查这些代码。好吧,那么我们可以向开发者展示一个他们不想看的丑陋 UI,没人会真正使用这个产品。我们认为这是我们让产品实质性变好的基础构建块。如果人们甚至不愿意使用这个构建块,这能走多远呢?对吧。我们只是觉得我们能提供的体验受到了限制。有趣的是,JetBrains 是一个比 VS Code 更可配置的范式,但我们在 Anshul 提到的两个方向上都感到非常受限,所以我们就想,嘿,如果我们真的消除这些限制,我们就能大幅加快速度。我们相信这对我们来说是一个必要的步骤。


我很好奇更多关于评估的事情,因为你提到了这个,而且每当有人提到评估时我们都必须问一问。是的。你如何评估这样的东西?你如何评估这样一个多步骤、跨越如此多上下文的东西?


06.

 Cascade 和 Windsurf 的评估方法


Varun : 所以你可以想象我们可以做的是,这也是代码的一个美妙之处,代码是可以执行的。我们可以去获取一堆开源代码。我们可以找到一堆提交,对吧?我们实际上可以看看这些提交中是否有相关的测试。我们可以开始剥离这些提交,剥离提交的方法很好,因为它测试了代码处于不完整状态的事实,对吧?当你在写提交时,目标并不是提交已经为你写好了。你得到的是一个状态,整个内容还没有被写完。我们能否真正检索到正确的代码片段,并提出一个连贯的计划和迭代循环,使你达到代码实际通过的状态?所以你实际上可以把这个复杂的问题分解成一个规划、检索和多步执行的问题。你可以看到在每一个方面都在变得更好。如果你在足够多的代码库中这样做,你就把这个高度不连续和离散的问题(使 PR 工作或不工作)转变成了一个连续的问题。现在这是一个你实际上可以攀登的山丘。这是一种你可以实际应用研究的方式,比如说,嘿,我的检索能力变得更好了。这使我的评估变得更好,对吧?然后注意评估的方式是,我对纯粹根据提交信息就完成整个任务的评估不太感兴趣,我更感兴趣的是代码处于不完整状态,甚至没有给你提交信息,因为这是关于开发者的另一件事。他们不愿意完全告诉你他们脑子里在想什么。这才是这个问题真正重要的部分。我们相信开发者永远不会完全阐述问题陈述,对吧?因为问题陈述存在于他们的脑海中。就像你我在咖啡区域进行的对话。 我在 Slack 上进行过的对话。我在 Linear 上进行过的对话。也许不是 Jira,我们就说 Linear 吧。这才是现在的潮流。


Anshul : 他们在谈论 Jira。


Varun : 是的,这些是我在 linear 上进行的对话。所有这些内容最终汇集在一起,提出了一个解决方案,这就是为什么我们想要测试不完整的代码。如果状态处于不完整状态会发生什么?我是否能在不提交的情况下通过测试?我是否能很好地猜出你的提交内容?现在,你可以将问题转化为一个掩码预测问题,在这个问题中,你既要猜测高层次的意图,也要猜测剩余的更改以使实际测试通过。你可以想象,如果你构建了所有这些,现在你可以看到,嘿,我的系统正在变得更好。检索质量正在提高。你实际上可以开始在越来越大的代码库上测试这个,对吧?我想这是我们老实说本可以做得更快的一件事。我们有技术可以很快地构建这些从零到一的应用程序。我认为人们正在使用 Windsurf 来实现这一点,这非常令人印象深刻。但我认为真正的价值实际上比这深得多。实际上,你拿一个大型代码库,它确实是一个很好的第一步。我不是说它是完美的,但它只会变得越来越好。我们有深层的基础设施,实际上正在验证我们在这个维度上正在变得更好。


Anshul : 你提到了我们对系统进行的端到端评估,我认为这非常酷。但我觉得你甚至可以将每个步骤都分解开来,对吧?比如说,就拿检索来说。我们如何才能让检索的评估变得真正出色?我认为这只是我们公司一直以来的普遍情况。就像大多数现有的软件开发评估和基准测试一样,有点虚假。没有更好的说法了。比如,你有 Swybench,那很酷。但实际的专业工作并不像 Swybench 那样。人工评估也是一样。这些东西有点不太对劲。所以当你试图针对一个有点问题的指标进行优化时,你最终会做出一些不太理想的决定。因此,我们一直非常热衷于探讨,对于系统的这个部分,我们真正想要测试的指标是什么? 以检索为例。很多基于嵌入的系统的基准测试都是类似大海捞针的问题。比如,我想从所有这些潜在的上下文中找到这一个特定的信息。这并不是真正适用于软件工程的,因为代码是一个超级分布式的知识库。你实际上需要从代码库的许多不同部分提取片段来完成工作,对吧? 所以我们构建的系统,不是只看一个检索结果,而是看 50 个。你能检索到的 50 个最高相关的东西是什么?你是否捕获了所有必要的部分?那么所有必要的部分是什么呢?你可以再次回顾旧的提交记录,看看为了完成一次提交,一起编辑了哪些不同的文件,因为这些文件在语义上是相似的,但如果你真的试图绘制代码图,可能并不会显示出来,对吧? 因此我们实际上可以构建这种黄金标准集。我们甚至可以对整体任务中的子问题进行这种评估。所以现在我们有了一个工程团队,可以在所有这些方面进行迭代,同时还能确保我们试图构建的最终目标真的非常强大,这样我们就能对我们推出的内容充满信心。


Varun : 顺便说一句,关于 sweep bench 这件事再多说一点。为了展示这些现有的东西,我认为基准测试并不是坏事。你确实需要基准测试。实际上,我更倾向于有基准测试,而不是所有东西都只凭感觉,对吧?但是感觉也很重要,因为它们展示了基准测试在哪些方面是不够有价值的,因为有时感觉能让你看到基准测试中存在的关键问题。但是你看看人们优化 sweep bench 的一些方式,比如确保每次 X 发生时都运行 PyTest。是的,你当然可以开始用各种可能的方式来提示它。如果你移除那些,它突然就不擅长了。那么真正重要的是什么?真正重要的是在广泛的任务中,你能为人们提供高质量的建议,而且人们喜欢使用这个产品。我认为这些东西的运作方式是,超过某个点之后,因为我确实认为超过某个点是有价值的。但一旦开始达到这些基准测试的峰值,获得最后那 10%实际上可能与基准测试的实际目标相悖。你可能应该找一个新的高峰去攀登,而不是进行 p-hacking 或者过度优化以在基准测试中获得更高分数。是的。


Alessio : 我们做了一期关于 Anthropic 最近的 SwyAgent、SwyBench 结果的节目。我们讨论了人工评估与 SwyBench 的对比。人工评估有点像一个全新的基准测试。你知道,你需要在那方面表现出色。SwyBench 更多是基于现有内容,但听起来,我的意思是,你们的评估创建方式与 SwyBench 类似,就像使用 GitHub 提交和那种历史记录。但随后它更像是在提交级别进行掩码,而不仅仅是测试输出结果。很酷。


好的,我们实际上收到了一些听众关于 Windsurf 发布的问题。很好。我们确实收到了一些听众关于 Windsurf 发布的问题。显然,我也想给你机会回应 Hacker News。


07.

 听众关于帆板运动启动的问题


Varun : 哦,天哪。嘿,让我告诉你一些非常非常有趣的事情。我和其他人一样喜欢 Hacker News。但是当我们推出我们的产品时,第一条评论,就在一年前,第一条评论是,这个产品是一个病毒。我们当时就像...


Anshul : 这是两年前 Codeium 的最初发布。这是原始版本。我正在分析这个二进制文件,稍后会汇报结果。


Varun : 然后他说,这是一个病毒。我就说,伙计,这不是病毒,伙计。


Anshul : 我们只想提供自动完成建议。这就是我们想要做的全部。


Varun : 嗯。好的。


Alessio : 哇。我没想到会这样。然后还有像 Teo 那样的戏剧性事件。发布会上已经有足够多的戏剧性了。但我不知道我们是否想把这仅仅变成一个 Cascade 的报道。不过,我们 Discord 上有很多人试用了产品,给出了大量反馈。人们有一个问题,就是对他们来说,Cascade 已经感觉相当有主动性了。这是你想要进一步发展的方向吗?显然,既然你刚刚在 ID 上发布,你现在主要关注让人们编写代码。但也许这是一种特洛伊木马,为的是做更多全面的端到端代码创建。就像 Devin 那样。是的。


Anshul : 我认为问题在于,如何以一种真正有原则的方式达到那个目标?显然,企业客户一直在问我们,比如说,什么时候能实现端到端的工作?现实情况是,好吧,如果我们在 IDE 中有一些东西,再次强调,它可以看到你的所有操作并获得大量的意图,而这些意图如果不在 IDE 中是无法获得的。我的意思是,如果那里的代理总是需要人类参与来不断修复自身,那它可能还没有准备好成为一个完全端到端的自动化系统,因为那样我们就会变成一个 linter,它会产生一堆东西,而没有人去查看任何一个。这不是一个理想的最终状态。但是如果我们开始看到,哦,是的,有一些人们常做的模式根本不需要人类参与,端到端完全可以工作,不需要任何基于意图的信息,那么当然,这可以变成完全自主的。而且,我们会很快了解到这些任务是什么,因为我们有大量的数据。


Varun : 也许可以补充一下,我认为如果答案是完全自主的,就像 Devin 那样,那么这个产品应该成为完全自主的,限制人类交互是目标,绝对是 100%的目标。老实说,在所有可用的产品中,我认为我们现在是最接近的,在所有可用的产品中。现在,让我说明一下,我认为还有很多尚未解决的难题,我们需要去解决这些问题才能真正实现这一目标。比如,我认为产品最烦人的部分之一是你需要接受每个被执行的命令。这其实相当烦人。我希望它能自己去执行。不幸的是,我去执行任意二进制文件会有一些问题,如果它删除了我的硬盘,我就不会...它实际上是一个病毒。我不是说黑客真的需要和你在一起。是的,它确实会变成一个病毒。我认为这可以通过复杂的系统来解决。我们喜欢研究复杂的系统基础设施。我认为我们会解决它。现在,解决这个问题的更简单的方法是不在用户的机器上运行,而是在其他地方运行,因为如果你买了那台机器,你就完全没问题了。不过,我认为在本地运行和远程运行之间可能有一些权衡,我们可能会改变对此的看法,但我认为这不是最终状态的目标。我认为这个目标是,A,它实际上能够以有限的人类交互完成非常复杂的任务,但它需要知道何时实际回到人类那里,对吧?此外,压缩代理运行的每个周期。现在,我甚至觉得这个产品有时对我来说太慢了。即使它运行得很快,客观上来说已经相当快了,我仍然希望它能更快,对吧? 所以在这里需要进行系统工作和可能的建模工作,以使产品在检索和生成两方面都更快,对吧?最后,我认为这里另一个非常重要的关键点是,如果我们能够主动为用户建议整个变更,那么明确要求人们做某些事情可能会成为一种反模式。想象一下,当用户使用产品时,我们会在用户甚至不需要询问的情况下就建议 PR 的剩余部分。我认为这只是过程的开始。但是,是的,这些都是难题。我无法给出具体的截止日期。我认为这比我们过去所拥有的是一个很大的进步。但我认为 Anshul 说的是百分之百正确的,我们的目标是在这方面做得更好。


08.

 远程执行和安全问题


Alessio : 我的意思是,远程执行这件事很有趣。你写过一篇关于本地主机终结的文章。是的。那时我们几乎在想,不,也许我们确实需要互联网,人们想要运行东西。但现在就像是,好吧,不,其实我并不在乎。比如,我希望模型能完成任务。如果你说,你可以端到端地完成一项任务,但它需要远程运行,而不是在你的电脑上运行,我相信大多数人会说,好的。


Varun : 不,我同意这一点。我实际上赞同它远程运行。这不是一个安全问题。我完全同意你的观点,即所有事情都有可能远程运行。


Swyx : 在大多数大型代码库中就是这样,比如 Facebook,没有人在本地运行东西。没有人这么做。


事实上,你连接到一个... 连接到主机的感觉。你说得对。也许对这些系统来说,比仅仅远程运行更重要的一件事是,基本上,你并不是在远程运行它。基本上,你知道,当你看这些代理时,有一种轨迹的展开。我想在某种程度上回溯这个轨迹,对吧?在某些方面,我想要系统的快照,我可以不断地检查点并来回移动。而且,除此之外,我可能想要进行多次展开。所以,基本上,我认为需要有一种方法几乎可以让系统向前和向后移动。无论是在本地还是远程,我认为这是必要的。但是每次,如果你向前移动系统,它就会破坏你的机器。这可能会是一个难以处理的系统,或者可能会破坏你的机器。这显然不是一个可行的解决方案。所以,我认为无论是本地还是远程,你仍然需要解决这个问题,即这个东西不会在每次执行时都破坏你的机器,如果这说得通的话。是的。


Swyx : 有一类新兴的基础设施提供商正在研究时间旅行虚拟机。


Anshul : 如果 Varun 在这个播客上的第一集有任何启示的话,那就是我们喜欢基础设施问题。是的,没错。


Swyx : 哦,所以你要谈这个。


Anshul : 好的。


嗯,这很有趣,对吧?就像,当我们最初拥有你时,你在实际的模型推理、优化等方面做了很多工作。而今天,几乎就像...是云,是 4.0。就像,你知道,人们似乎在忘记模型本身,你知道,现在一切都是在更高层次的抽象上。是的。


Varun : 所以,也许我可以稍微谈谈我们在这方面的策略是如何演变的。因为它客观上确实发生了变化,对吧?如果我说它没有变化,那我就是在撒谎。像自动完成和超级完成这样在每次按键时运行的功能完全是我们自己的模型。顺便说一下,这仍然是因为像 FIM(填充中间)这样的功能在当前...是不存在的。它们非常糟糕。根本不存在。实际上,它们在这方面并不擅长。


Swyx : 因为 FIM 是一种实际的,就像,你如何排序这些标记。


Varun : 是的,实际上在某些方面是关于你如何排列标记。如果你看看这些产品已经变成了什么样子,这很棒,很多云服务在开场广告中都专注于类似聊天的助手 API,它是完整的工作片段、消息、另一个完整的工作片段。所以,是多轮的来回系统。事实上,即使是这些系统在进行点对点的更改时也不是很擅长。当它们进行点对点更改时,它们有时会有一点偏差。因为是的,当你进行多点对话时,你知道,精确的 GIF 应用还不是一门完美的科学。所以我们关注这一点。我们实际上训练模型的第二个部分是检索系统。这甚至不是为了嵌入,而是实际上能够使用高性能的LLMs来对代码库进行更高质量的检索,对吧?所以,这实际上就是 Anshul 所说的。对于许多系统,我们确实认为嵌入有效,但对于复杂的问题,我们不认为嵌入可以概括特定查询的所有细节。比如,想象一下我对一个代码库有一个问题,找出这个代码库中所有的二次时间算法。我们真的相信嵌入可以概括这个函数是二次时间函数这一事实吗?不,我不这么认为。所以,在这个任务中你会得到极低的精确率和召回率。因此,我们需要应用一些更强大的东西来实际完成这个任务。所以,我们实际上构建了大型分布式系统来实际运行这个。在大规模上运行这些。在大型代码库上大规模运行自定义模型。所以,我认为更多的是这个问题。目前的规划模型,毫无疑问,我认为云服务和 OpenAI 拥有最好的产品。 我认为 LLAMA4,取决于它的发展方向,可能会有实质性的提升。很明显,他们愿意投入与 OpenAI 和 Anthropic 类似规模的计算资源。所以,我们拭目以待。如果他们真的做得很好,我会非常高兴,但目前还不确定。


不要忘记 Grok。


Varun : 嘿,老兄,我觉得 Grok 也是可能的。是啊。对吧?我觉得,别怀疑 Elon。


好的。我其实并不知道。当我使用 Cascade 时,这并不明显。我还应该提到,你知道,我参与了预览。谢谢你让我加入。我已经长期主要使用 Windsurf 了。这实际上并不明显。你没有明确表示你正在运行自己的模型。是的。我觉得你应该这样做。这样,我感觉它会有更多的差异化。比如,我只能通过你的 IDE 独家访问你的模型,而不是像现在这样有云端和 4.0 的下拉选项。


Varun : 因为我实际上以为那就是你们所做的。不是。实际上,它的运作方式是,模型中进行的高层规划实际上是通过云等产品完成的。但是极快的检索,以及将高层规划实际应用到代码库的能力,是内部运行的专有系统。


09.

 Codeium 策略的演变


Swyx : 然后你说的关于嵌入不够的那些内容。你熟悉所谓的后期交互吗?


Varun : 不,我实际上从未听说过它。是的。


Swyx : 所以,这就是 Colbert,或者说,是那个来自斯坦福的 Omar Khattab 一直在大力推广的东西。基本上就是你所做的。好的。从某种宽泛的意义上说,它是基于检索的嵌入而不是预先嵌入。


Varun : 我认为这听起来是个非常好的想法,与我们正在做的非常相似。


Anshul : 听起来是个非常好的主意。


Varun : 我想我们会这么说。这就像是奥巴马给自己颁奖的那个梗一样。


好吧,我的意思是,通过对比这些想法并看看研究观点的差异,可能会有一些值得学习的东西。它也被非常有效地应用于视觉理解。因为视觉模型往往会消耗整个图像,如果你能够根据查询来关注图像的某些部分,我认为这可以让你获得很多额外的性能提升。


Anshul : 以分布式方式使用计算来对整套原始数据进行操作,而不是对物化视图进行操作,这种基本思想并不是什么新鲜事物,对吧?我认为关键在于,这对LLMs来说会是什么样子?


当我听到你说,比如构建大型分布式系统,你有一个非常奇特的产品策略,既面向个人开发者,又面向大型企业。是的。是否使用相同的基础设施来服务所有这些需求?


我认为答案是肯定的。答案是肯定的。而且唯一的原因是肯定的。老实说,我们公司比我想象的要复杂得多,如果我们只想服务个人用户的话。我告诉你这一点是因为我们实际上并不会付费让其他供应商为我们的索引做事。我们不会付费让其他供应商来为我们自己的客户模型提供服务,对吧?我认为这是我们公司内部的一项核心能力,我们决定自己构建,但这也使我们能够确保当我们在适合这些大型企业的环境中提供这些产品时,我们不需要对外说,我们需要为你们构建这个定制系统,对吧?这是为我们整个用户群服务的同一个系统。所以这是我们公司做出的一个非常独特的决定,我们承认可能有更快的方法可以完成这项工作。


我在想,你知道,当我和你一起为你的企业项目工作时,我在思考这种"慢即是快"的理念,就像是有意识地为你真正瞄准的市场构建恰当抽象层次的产品。


**Anshul :**是的,我的意思是,当写那篇文章时,回头看并重读它,听起来几乎是显而易见的。并不是所有这些都是我们有意识做出的决定。我首先承认这一点。但是,它确实有帮助,对吧?当我们去拜访一个拥有数万名开发人员的企业时,他们会说,哇,你知道,我们有数万名开发人员,你们的基础设施能够支持数万名开发人员吗?我们可以回答说,我们在个人计划中已经为数十万名开发人员提供服务。我想我们应该能够支持你们,对吧?所以,能够做到这些事情,我们一开始只是想,让我们把它提供给个人,看看人们喜欢什么不喜欢什么,然后学习。但后来这些就成为了我们面向企业时的价值主张。


Alessio : 回顾一下,当你第一次来到播客时,自动补全是免费的。而 Copalo 是每月 10 美元。你说,看,我们关心的是在代码补全之上构建东西。你是如何决定不专注于短期的、类似于个人开发者的增长货币化,而是去构建这些东西的?因为另一种选择本可以是,嘿,所有这些人都在使用它,所以我们要推出另一个每月 5 美元的计划来赚钱。


10.

 Cascade 及其功能


Varun : 我认为这可能有点像是公司的一种商业直觉,但不确定这种商业直觉是否正确。我认为现在,针对个人开发者赚钱的优化策略可能实际上是错误的。主要是因为我认为个人开发者可以很快地切换产品。除非我们有非常大的领先优势,否则试图从个人开发者身上获取大量利润的做法可能会被其他人迅速瓦解,然后他们就会转向另一个产品。我要非常诚实地说,对吧?比如,当你在个人层面使用像 Codeium 这样的产品时,没有什么能阻止你切换到另一个产品。我认为随着时间的推移,随着产品变得越来越好、越来越深入,这种情况会改变。我经常说,商业上有一本叫《七种力量》的书,我认为像我们这样的企业需要拥有的一种力量就是真正的转换成本。但是,在考虑如何让人们难以切换之前,你首先需要在产品中有一些东西让人们愿意使用并继续使用。我认为对我们来说,我们相信在企业领域可能会有更多的差异化,通过以一种有趣且可扩展的方式与这些大公司合作。让我说得更具体一些。个人开发者对小的价格变化更敏感。他们更在意这个,对吧?比如,如果我们的产品是每月 10、10、20 美元,而不是 50 或 100 美元,这对他们来说很重要。但对于一个已经在软件上花费数十亿美元的大公司来说,这就不那么重要了。所以你实际上可以为他们解决更深层次的问题,并且可以在这个角度上提供更多的差异化。 然而,如果你是一家大公司,我认为只要我们没有最好的产品,个人开发者就可能会流失。所以要专注于成为最好的产品,而不是试图通过定价来从人们身上赚取大量金钱。我认为在可预见的未来,我们不会成为一家试图从个人开发者身上赚取大量金钱的公司。


Swyx : 我的意思是,这是有道理的。那么为什么 Windsurf 要收费每月 10 美元呢?


Anshul : 为什么是每月 10 美元?每月 10 美元实际上是专业版计划。我们在 Windsurf 存在之前就推出了个人专业版计划。因为我认为,让我们都闭嘴吧,我们也必须在财务上负责任。对吧?是的,是的。我们不能耗尽资金。由于我们的基础设施背景,有很多东西我们可以基本免费提供,比如无限的自动完成,在我们更快的模型上无限的聊天。我们实际上有很多东西是免费的。但是,当我们开始做超级完成和大量索引以及所有这些事情时,确实存在实际的成本。我们不能忽视这一点。所以我们创建了每月 10 美元的专业版计划,主要是为了覆盖成本。我认为我们在那里也没有多少利润空间。但是,好吧。就是为了在那里覆盖我们的成本。所以对于 Windsurf 来说,最终也是一样的。每个在最初几周内下载 Windsurf 的人都可以免费使用两周。让人们试用一下。让他们告诉我们他们喜欢什么,不喜欢什么。这就是我们一直以来的运作方式。


Alessio : 我和很多财富 100 强公司的首席技术官交谈过,他们大多数的工程师实际上并没做多少事。问题不在于开发者的薪资是 20 万美元,而你节省了 8 万美元。问题在于,那个开发者本不应该拿 20 万美元。但那种薪资几乎成了基准价格,你知道吗?然后你有些开发者拿 20 万美元,但他们应该拿 50 万美元。所以这几乎就像你在平均化薪资,因为大多数人实际上并不那么高效。所以如果你给他们 20 万到 50 万美元,你知道吗?就像底层被挤压,而顶层被抬高。


Varun : 是的,也许吧,Alessio,我经常思考的一件事,因为我确实经常思考这个问题,Perseat,以及所有这些东西。让我们以 Office 365 为例。我可以说,Codeium 的一位律师使用 Microsoft Word 的频率远高于我。我们支付的费用是一样的。但他从 Office 365 获得的价值可能是数万美元。顺便说一下,大家都知道,Google Docs 是个很棒的产品。Microsoft Word 是一个疯狂的产品。它使得一旦你在 Microsoft Word 中审阅任何内容,你只能与其他使用 Microsoft Word 的人一起审阅。它就像一种渗透一切的病毒。它不仅渗透到公司内部,还渗透到公司之间。对他来说,它带来的价值要高得多。所以对于这类产品,总会存在使用者之间价值获取的差异,对吧?你说得对,这几乎就像是一种混合模式,因为你完全正确。可能这家公司应该为那个开发者多付四倍的费用。但从某种奇怪的角度来看,软件是一种团队活动,以至于产生了许多混合的结果。但是,嘿,四个人中的一个人获得四倍价值的 20%仍然能够覆盖成本,对吧?在四个人之间分摊,对吧?这大致就是这些产品的定价方式。


Alessio : 我的意思是,这不仅仅关乎定价,更多是关于软件工程师的未来。我们也可能大错特错。是的,我认为没人知道。


Swyx : 保留极度离谱的权利。


Anshul : 是的。


11.

 多智能体系统


Swyx : 我的意思是,商业模式确实会影响产品。产品确实会影响用户体验。所以这些都是一体的。我不介意。我们确实像关注技术本身一样关注科技的商业方面。这很酷。说到这里,还有其他听众的问题。向 Daniel Imfeld 致敬,他在我们的 Discord 上非常活跃,问了所有这些问题。多代理系统现在非常热门和流行,尤其是从微软研究的角度来看。你在这方面做过任何探索吗?


Varun : 我认为我们有。我不认为我们称之为多智能体,这更像是一旦你有了这种可以产生多个轨迹的概念,可以验证一些不同的假设,然后你可以选择最有趣的一个。这些其实是我们在公司内部已经分析过的东西。顺便说一下,我们之所以没有把这些东西放进去,部分原因是我们不能同时在其他方面随意并行执行一些东西。因为会有副作用。因为会有副作用,对吧?所以有些事情在某种程度上取决于我们在内部解锁更多的功能。另一方面,短期内,我认为还有一个延迟因素。我认为所有这些问题都是可以解决的。我实际上相信所有这些都是可解决的问题,而不是无法解决的问题。如果你想并行运行所有这些,你可能不希望 N 台机器去执行。我认为这是不必要的,特别是如果大多数操作都是 IO 绑定的,你所做的只是读取一点数据和写出一点数据。这并不是计算密集型的。我认为这是一个好主意,可能是我们将来会追求的,并且会出现在产品中。


Swyx : 我还在消化你刚才说的关于事物受 IO 限制的内容。所以对于某一类并发,你实际上可以在一台机器上运行所有内容。是的,为什么不呢?


Varun : 因为如果你看看这些变更,对吧,对于其中一些,它写入的只是几千字节?可能每棵树上只有几万字节。这并不多。非常小。


Swyx : Cascade 或 Windsurf 的下一步计划是什么?


Anshul : 哦,有很多。我不知道。我们进行了一次内部投票,我们就问,你是对这次发布更兴奋还是对一个月后的发布更兴奋?或者我们一个月后要推出的东西?结果几乎一致地选择了一个月后。我想有一些显而易见的原因。我不知道你想说多少。我不想多说。但我认为你会看到系统的所有相同方面。我们如何改进知识检索?我们将一直努力改进知识检索。在我们的发布视频中,我们甚至展示了一些早期探索,关于查看其他数据源。这对于从零开始构建应用的个人开发者来说可能不是最酷的事情,但你可以相信企业客户真的认为这很酷。我认为在工具方面,我们还有很多可以做的。我的意思是,当然,Vern 谈到了不仅仅是建议终端命令,而是实际执行它们。我认为这将是巨大的。在锁定方面,你看看人们正在采取的行动,比如人类的行动,我们可以构建的轨迹。我们如何让它变得更加详细?我认为所有这些,再加上一些更清晰的用户界面,比如查看未来轨迹的想法,尝试一些不同的东西,并建议可能采取的下一步行动。这还不真正存在,但我认为它会是什么样子是很明显的。你打开 Cascade,不是开始输入,而是像这样,这里有一堆我们想做的事情。我们开玩笑说 Clippy 要回来了,但也许现在是 Clippy 真正闪耀的时候了。所以我认为我们有很多方向可以发展,这就是非常令人兴奋的部分。我们称每次发布为"浪潮",我相信是因为我们真的想加倍强调水上主题。


Swyx : 哦,是的,公司里真的有人玩风帆冲浪吗?那是...


Varun : 我


我们正在实现我们的梦想


Varun : 足够酷到可以在岩石间玩风帆冲浪。


Anshul : 是的,我认为我们做不到。


Varun : 好的,行。


Anshul : 这其实是我们学到的东西,因为我认为我们中没有人是帆板运动员。比如在我们的发布视频中,我们有人在帆板上使用帆板。你看到了吧?你在视频开头看到了。有人在电脑前。我们当时没有意识到,现在显然是一年中风力不足以进行帆板运动的时候。所以我们试图想办法用帆板在帆板上完成这个发布视频。我们联系的每个帆板运动员都说,是的,这是不可能的。但有一个疯狂的家伙说,是的,我觉得我们可以做到。然后我们真的做到了。哦,好吧。


12.

 Windsurf 的改进领域


Swyx : 这很有趣。有什么你想要得到反馈的吗?也许有一个分岔路口。你想要反馈。你希望人们对这个播客做出回应,告诉你他们想要什么。


Varun : 是的,我认为产品还有很多方面可以更加完善,我们希望改进这些地方。我们将在许多不同的环境中提高性能。我认为我们很乐意听到各方面的反馈。比如,如果你使用某个环境,你用 Windows 的某个版本,它不能工作。或者在某种语言中表现很差。我们希望听到这些反馈。是的,我因为 Python 的问题给 Preb 和 Kevin 提了很多意见。我认为在环境方面还有很多需要改进的地方。例如,即使是一个简单的例子,我想 Swyx 也经常提到这个,就是虚拟环境,终端在哪里运行?这些都是什么?这些都是一些基本问题,老实说,这不是什么高深的科学,但我们需要解决它,对吧?我们需要解决它。所以我们很乐意听到关于产品的所有反馈。比如,它是不是太慢了?哪里太慢了?在哪些环境中它可以运行得更好?有很多事情我们还不知道。幸运的是,我们内部每天都在使用这个产品,所以我们在内部得到了很多反馈。但我要说,这里有一点硅谷主义的倾向,因为我们中的很多人都是在 Mac 上开发的。再次强调,超过 80%的开发者使用的是 Windows。所以是的,我们还有很多需要学习的,未来可能还有很多改进的地方。


Swyx : 作为公司的 CEO,你个人是否尝试过切换到 Windows 系统,只是为了体验一下不同的感觉?


Varun : Windows。你知道吗?


Swyx : 感受痛苦。


Varun : 你知道吗?也许我应该。


Swyx : 实际上,我想我会的。我是说,你的客户,每个人都说 Windows 占 89%,对吧?你生活在 Windows 中,你绝不会错过任何东西。


Varun : 所以我认为在开始时,我们之所以犹豫这么做,部分原因是我们的许多架构决策都是为了在每个 IDE 上运行,因为我们构建了一种平台无关的方式,在用户的本地机器上运行系统,这种方式只能在特定类型平台上的开发容器中轻松构建,因此 Mac 对此很适合。但现在如果我也可以对 UI 等进行修改,就没有什么借口了。而且,WSL 也存在。这实际上是我们需要添加到产品中的东西。我们现在还处于如此早期的阶段,以至于我们实际上还没有添加这个功能。我们还没有远程功能。


13.

 打造一家以企业为先的公司


Swyx : 关于 Codeium 整体还有什么其他内容吗?你们仍然有你们的核心业务,即企业版 Codeium?是的。那边有什么进展或者有什么人们应该知道的吗?


我认为很多人仍在转移过去,对吧?我觉得这有点像,你知道,非常自负地认为,哦,我们现在有了 Windsurf,我们所有的企业客户都会转向 Windsurf,这是唯一的选择,不,我们仍然支持其他 IDE。我本来想说,


Swyx : 你刚才提到你的 Java 开发人员喜欢 JetBrains。他们永远不会离开 JetBrains。


他们不是。我的意思是,别说 JetBrains 了,仍然有大量企业用户在使用 Eclipse。比如,我们仍然是唯一一个在 Eclipse 中有扩展的代码助手。这一点多年来一直没变,对吧?但这是因为那些是我们的企业客户。我们一直在思考的是,如何为每个开发者最大化 AI 的价值?我认为这一点从一开始就没有改变,对吧?这涉及到很多与开发者在哪里就在哪里接触的问题。所以,我认为在企业方面,我们仍然非常投入。我们有一个专门的工程师团队致力于让企业成功并思考企业问题。但从宏观角度来看,如果我们能为企业解决所有企业问题,并且我们有开发者真正喜爱的产品,那么我们就从两个方面解决了问题。我认为这是其中之一,当我们开始与企业合作并开始构建开发工具时,对吧?我们最初是一家基础设施公司。现在我们正在为开发者构建开发工具。你很快就会理解并意识到开发者喜爱这个工具对我们在企业中取得成功有多重要。有很多企业软件是开发者讨厌的。我想画一个飞轮图。但是,我们正在为人们提供一个他们用来完成最重要工作的工具。他们必须喜欢它。这不是我们在试图说服,这家公司的高管也经常问他们的开发者。你喜欢这个吗?这几乎总是 Codeium 是否被组织接受的一个关键方面。如果我们没有一个开发者喜爱的产品,我认为我们不可能在不到一年的时间里在企业产品中从零增长到 1000 万美元的年度经常性收入。 所以我认为这就是为什么我们只是,IDE 更多的是一种开发者喜爱的玩法。它最终会进入企业。我们仍然解决企业问题。再说一次,我们可能完全错了,但我们希望我们正在解决正确的问题。


这很有趣。我在我们开始录音之前问过你这个问题,但是,这是同一个团队。就是同一个 edge 团队。就像,在任何正常的公司或者,你知道,我对公司构建的正常心理模型中,如果你有两个这样实际上不同的产品,你会有两个不同的团队来服务两种不同的需求,但这里是同一个团队。是的。


Varun : 我认为我们公司的独特之处之一是,这并不是一直都是同一家公司,对吧?比如我们最初是一家 GPU 虚拟化公司,然后转型到这个领域。之后,我们又做了一些改变,我认为公司具有一定的多样性和这种能力,可以根据我们的直觉行动。顺便说一下,这种直觉可能是错的,但如果我们嗅到了什么,我们就会迅速行动。我认为这更多地体现了工程团队的实力,而不是我们任何一个人的功劳。


14.

 Copilot for X、AI 用户体验和企业 AI 博客文章


Alessio : 当然,你提到了 2022 年 12 月 19 日。我们的一位嘉宾发布了关于构建 X 的 Copilot 真正需要什么的帖子。估算推理以确定延迟质量。构建第一方而不是使用第三方作为 ABI。好的。弄清楚实时性,因为 chat GPT 和 DALI DALI 在 RFP 中太慢了。优化提示,因为上下文窗口有限,这可能现在已经不那么正确了。然后将模型输出与用户体验合并,使产品更直观。你还有什么要补充的吗?我会给自己


Anshul : 我给那个打个 B 减。其中有些部分是准确的。甚至像你提到的那个背景。是的,现在模型的上下文长度确实更长了。这绝对是真的。它增长了很多。但是看看企业的代码库。它们有数千万行代码,相当于数千亿个标记。这永远不会改变。所以能够很好地拼凑这种分散的知识仍然很重要。因此,我认为那里有一些数据仍然相当准确。可能有一些不太准确。第一方与第三方的问题。我想我们在那里错了。我认为我会把它细化为,有些东西确实很重要要第一方来做。比如自动完成。你有一个非常特定的应用,你不能仅仅通过提示工程或者之后的微调来解决。你就是做不到。我认为这里有一定的道理。但是我们也要现实一点。像 Cascade 和 Windsurf 这样的第三方模型提供商推出的东西,如果没有 4.0 和 3.5 的快速改进,是不可能实现的。那根本就不可能。所以我给自己打个 B 减。我会说我及格了。但是,这已经是两小时和两年之后的事了。


仅供明确,我们不是在打分。这更像是你会怎么做,你知道,他们现在在哪里?你会添加什么?你喜欢什么?是的,我的意思是,


Anshul : 第一篇帖子,对吧?那是在我们刚刚推出 Codeium 的几周后。我记得那时 Swyx 和我在讨论,也许我们可以写这个,因为我们是人们可以实际使用 AI 的最早产品之一。这很酷。


Swyx : 我特别喜欢 X 的副驾驶功能,因为当时每个人都对它很感兴趣。


Anshul : 每个人都只是觉得,你知道,就是那样而已。但我认为,你知道,我们当时并没有企业级产品。我甚至不认为我们当时在考虑企业级产品。对吧?所以,我们从企业角度获得的所有经验教训,这也是为什么我喜欢第三次回到博客上的原因。其中一些,我认为我们算是弄明白了。有些,我们说实话是无意中发现的。在很多方面我们都必须靠运气。比如我们有很多机会和交易,由于各种原因我们失去了,我们不得不从中吸取教训。还有太多可以补充的内容,以至于我在 2022 年不可能把这些都说对。


Varun : 我能提一件我认为是,希望这不会引起太大争议,但这是关于我们整个工程团队的真实情况。我认为我们大多数人并没有从 ChatGPT 中获得太多价值。主要是因为我认为问题在于,这可能有点不同。就像公司里很多工程师已经编写软件超过八年了,这并不是说


Varun : 他们并不是在搜索 Stack Overflow。他们在搜索代码库方面投入了大量精力。对吧?他们能非常快速地浏览代码。速度 incredibly 快。就像每一种工具一样。他们花了大约八年时间来掌握这项技能。而 ChatGPT 作为一个需要提供大量上下文的附加工具,我们实际上无法真正使用它,比如我的联合创始人基本上从未使用过 ChatGPT。他从未使用过。可能因为这个原因,当时我们的一个错误假设可能是,嘿,像这样的被动系统需要变得更好,因为它们总是存在,而这些主动系统会落后。我认为实际上,Cascade 是一个重大突破。现在公司里每个人都在使用它。字面意思是每个人。包括最大的怀疑者。我们公司有很多对 AI 持怀疑态度的人。我认为这实际上很重要。为什么要雇佣他们?不,我认为重要的是,那些之前对 AI 持怀疑态度的人曾在自动驾驶汽车领域工作。这些不是加密货币领域的人。这些人关心技术,想要为未来工作。他们对"好"的标准非常高。他们不会形成一个崇拜,


Varun : 我不会成为 Twitter 上那种说"这改变了一切"的人。比如说,软件,我们知道它已经死了。不,会有一些人非常诚实,我们知道如果我们达到了对他们有利的标准,我们就找到了特别的东西。我想在那个时候我们可能有很多这样的情绪。现在这种情况已经发生了很大变化。我认为有一些非常具有前瞻性的信徒和一些能够约束它的人是很重要的。否则,你就会像自动驾驶汽车一样。你有一个非常具体的问题。人们只是在真空中工作,没有任何信号让你回到现实。你没有好的方法来否定想法。我们会想出很多糟糕的想法。但我们需要想出糟糕的想法。否则,好的想法怎么会出现呢?我不想称这些人为怀疑论者。怀疑论者意味着他们不知道。他们是现实主义者。他们是那种当看到产品网站上有等候名单时,根本不会相信的人。他们根本不会去考虑它。


Swyx : 赞赏你不用等候名单就直接发布了。


顺便说一下,我们永远不会以等候名单的方式推出产品。我们永远不会以等候名单的方式推出产品。这是公司的一个原则。我们宁愿成为一个被认为是无聊的公司,也不愿成为一个偶尔推出产品并希望产品表现良好的公司。


我开的玩笑是生成式人工智能已经非常擅长生成等候名单了。还有,


为了澄清一下,我们两个人以前都在自动驾驶汽车领域工作过,所以这并不是对自动驾驶汽车的批评。我们热爱那项技术。


Varun : 我们喜欢它。我喜欢困难的技术问题。


Swyx : 这就是我活着的意义。太棒了。只是想反驳一下第一方的说法,我承认大型模型实验室已经为你做了很多你不需要重复的工作。但是你现在拥有如此多的专有数据,可能值得对你收集的轨迹进行训练。所以也许这是一个回归到第一方的钟摆效应。是的,


我的意思是,我认为,我是说,从安全态势的角度来看,我们一直都很明确。我认为这既关乎客户信任,也涉及到,我是说,我有点想要,比如说,让我选择加入。我认为我们确实从用户那里获得了一些可以利用的信号。比如,我们获得了大量的偏好信息。这实际上是


Varun : 你所说的关于我们的轨迹,我们的轨迹很好。我要说的是,我们拥有的超级完整产品之所以能够有实质性的改进,不仅是因为我们使用了合成数据,还因为我们从用户那里获得了偏好数据,比如说,给定这些轨迹集,这才是一个好的结果。事实上,我们产品的一个非常美妙的部分,也是与 ChatGPT 非常不同的地方是


Varun : 接受发生了,而且不仅仅是接受。对吧?比如说,你接受了它,但在接受之后,你又删除了其中的三四个项目。我们可以看到这一点。所以这实际上让我们能够获得比接受更好的指标。因为我们处于最终的工作中


Anshul : 开发者的输出。这是接受度和实际发生情况之间的偏好。如果你能真正获得实际发生情况的真相,这就是身处 ID 的美妙之处,那么是的,你在那里能获得很多信息。你有这个吗


Swyx : 这是使用扩展还是纯粹的 Windsurf?


Anshul : 我们在扩展程序中遇到过这个问题。好的,很好。


Swyx : Windsurf 只是给你更多的 ID。是的。


Varun : 这意味着你也可以开始获取更多信息。比如说,Anshul 提到的基本情况,我们可以看到是否打开了文件资源管理器。这实际上只是一条我们以前无法看到的信息。当然。是的。


Anshul : 里面有很多意图。很多意图。第二个。哦,天哪。


如何制作人工智能用户体验


Anshul : 你的模式。哦天哪。我们现在创造了完整的用户体验,然后是 ID,这不是很有趣吗?我认为那个是相当准确的。


Swyx : 那个是 A 吗?


Anshul : 我想这一点我要给自己打分。我认为我们在扩展中就是这样做的。我仍然认为这在扩展中也是正确的,对吧?比如,我们在很多事情上都变得非常有创意。就像 Ruin 提到的想法,本质上是渲染图像来展示东西。我们要发挥创意来找出正确的用户体验。我们可以创建一个非常简单的用户界面,比如侧边栏之类的。但不,实际上多付出一些努力确实可以使那种体验尽可能地好。但是现在,看看我们能在 Windsurf 中构建的一些用户体验,真的很有趣。当我第一次看到,因为现在我们可以在终端中使用命令,你不必搜索 bash 命令。当我第一次看到时,我就开始微笑,这不像 Cascade,也不像实验室里的 Gentic 系统。但我觉得这是一个非常非常酷的体验。我们在 VS Code 中根本无法做到这一点。


Swyx : 是的,我理解。我已经实现了一个名为 please 的 60 行 bash 命令


是的,请继续


Varun : 英语,然后你知道,这其实真的很酷,因为我们相信的一件事是,我实际上更喜欢像自动完成这样的产品,而不是纯粹的命令,因为我甚至不想打开任何东西。所以那种我只需要输入而不必按一些按钮快捷键去到不同地方的方式,我也很喜欢。


是的,我最初采用了终端工具 warp,因为他们免费提供了这个功能。但现在这种功能到处都有,所以我可以关掉 warp,不用把我的 bash 命令给 Sequoia 了。


我同意你的观点。


Alessio : 不,我使用 warp。不,不,你看我使用 warp。好吧,我不知道我要开始抱怨了。希望有人能听到。这就像是对 warp 产品的反馈,但他们基本上有这样一个功能,你可以输入井号然后用自然语言写,但他们也会自动推断你输入的是自然语言,这两者是不同的。当你使用井号时,它只会给你一个预设的命令;当你与它对话时,它会生成一个流程。好吧,这是一个有点令人困惑的用户体验。但回到你的帖子,你提到了用户体验的三个 P,对吧?它们是什么来着?Present(呈现)、practical(实用)、powerful(强大)。


Swyx : 实际上,那真的很好。


我喜欢它。我认为在开始时,仅仅存在就足够了,你知道,甚至当你推出时,人们会说"哦,你有 AI,那很酷,其他人没有"。你认为我们是否仍处于这样一个阶段,即体验才是最重要的,模型甚至不需要那么强大,只要有更好的体验就足够了?还是说你认为真正重要的是能够做到全面,因为你的观点是,当你为客户创造大量价值时你就很强大,而当你只是以更好的方式包装它时,你就很实用。是的。


Anshul : 我们在市场上处于什么位置?我认为总会有实用型用户体验的空间,就像获得命令终端那样,那是一种非常实用的用户体验,对吧?我认为像 Cascade 这样的代理系统,我们开始变得强大起来,因为从用户体验的角度来看,有很多细节让 Cascade 变得非常好。这些都是一些分布各处的微小细节,但你知道,我们正在流式处理,我们展示变化,我们允许你跳转并打开差异查看,我们可以运行后台终端命令,你可以看到正在运行的后台进程,这些小的用户体验细节汇集在一起,形成了一个强大而直观的用户体验。我认为我们正在接近这个目标。这肯定只是个开始,这就是为什么我们对这一切的未来发展如此兴奋。我认为我们开始看到了它的雏形。我很兴奋。这将是一个全新的局面。是的。


太棒了。首先,与你合作真的非常愉快。我确实与许多客座作者合作,但并非每个人都能坚持到最后,而且没有其他人做到过三次,所以值得称赞。


Anshul : 记住我们的帽子戏法。


这个更像是关于金钱的那个,你知道这很有趣,因为我认为开发者对金钱相当不感兴趣。这不是很奇怪吗?


Anshul : 是的,我的意思是,我不知道这是否只是我们公司的特性。你知道,我觉得你说过的一点,就是所有那些旧金山的 AI 公司,大家都在互相炒作技术和一切,这很好,技术确实非常重要。我们在 Mountain View 这里有一个漂亮的办公室,我们真正关心的是实际创造价值和赚钱,这是公司的核心部分。


Varun : 我认为也许说这话的自私方式,或者说更无私的方式是,是的,我们可以永远做一家由风投资助的公司,但从根本上讲,你知道,如果我们真的想改变软件开发的方式,我们需要业务中有一部分能够产生现金,使我们能够真正大量投资于软件开发,而且这部分现金需要是持久的,不是第二年就流失的现金。我们希望将自己打造成一家持久的公司,能够真正解决这些问题。


是的,是的,非常好。对于那些显然我们会在节目注释中提供链接的人来说,但对于第一次听到这个的人,我在给这篇文章命名时遇到了很多麻烦,所以我们最初称它为你有类似"如何赚钱"之类的标题


Anshul : 我忘记了,非常抱歉,我当时好像是在飞机上,为此我表示歉意


Swyx : 他在标题中使用了三个美元符号,我觉得我不能那样做,所以要么是为企业构建 AI,然后我还说了 AI 初创公司能做的最糟糕、最危险的事情就是为其他 AI 初创公司构建产品,我想你们俩都会同意这一点。我认为基本的主旨,也是我非常喜欢的,就是"慢下来才能走得更快"。如果你从一开始就真正为安全、合规、个性化、使用分析、延迟预算和规模化而构建,那么你现在会付出代价,但最终在长远来看会得到回报。这就是真正的洞见,你以后是无法做到这一点的。如果你先构建一个简单的东西作为最小可行产品,就像只是用最容易做的东西发布,然后再添加 enterprise ready.io 那套 12 个企业级功能,你最终会得到不同的产品,或者比从一开始就做好更糟糕。这是我以前从未听说过的观点。


Anshul : 是的,我的意思是我们反复看到这种情况。就像现在,我们有很多国防领域的客户,例如我们正在进行 FedRAMP 认证,我们正在合作的人看到了所有这些事实,比如我们已经有了容器化系统,我们已经可以以这些方式部署,我们已经完成了安全方面的工作,他们就说:"哦,你们在做这件事时会比大多数公司容易得多。"大多数公司只是说:"好吧,我们有一个大型 SaaS 系统,现在我们需要做所有这些事情。"这可能听起来很深奥,但我认为任何在公司里长期从事某个项目的人可能都见过这种情况。技术不断进步,然后你意识到你必须重新设计整个系统才能获得改进。当你已经投入了这么多努力时,要做出这种改变是非常困难的。人们投入了重要的时间,情感上也有投入,无论是什么原因,做出改变都很难。 我相信我们也会遇到这种情况。是的,我认为我们比大多数公司做得更早一些,但我们肯定会遇到需要重新设计系统某些部分的时候。实际上,我们已经遇到了这种情况。我认为这只是在项目层面、产品层面,还是整个公司层面?我认为这里的论点是,在某种程度上,你的公司需要从一开始就具备这种 DNA,我认为这样你就能更顺利地度过这些坎坷,并能够创造价值。我不知道


Varun: 我想说两点。第一点是,这是我和我的联合创始人 Douglas 经常讨论的问题。就像是一个持续存在的"自建还是购买"的问题。我认为答案是,很多时候应该选择购买。比如我们不会去开发自己的销售工具,我们应该去购买 Salesforce,自己开发是愚蠢的,这是没有差异化的。选择购买而不是自建的原因是,从机会成本的角度来看,现有产品的投资回报率是很好的,实际上去购买比自己开发做得更差要好。有专门的公司在专注于这个。 但这里有一个隐藏的重要问题:当你选择购买时,你失去了公司内部的一项核心能力,而这是一项你可能永远无法获得或很难获得的能力。初创公司的时间非常有限。比如说,假设作为一家公司,我们没有投资于,比如说模型推理,我们有自定义的推理运行时,如果现在放弃它,我们将很难再重新获得它。我们就只能使用 VLM,那将是我们唯一的选择。或者说,如果我们使用 VLM,我们现在就不会和你交谈了。 但关键是,这更多是一个从第一原则思考的问题。比如 Google 是一家很棒的公司,赚了很多钱,如果他们实际上让别人为他们构建搜索索引产品会怎样?也许其他人可以做得很好,也许这是个不恰当的例子,特别是因为 Google 就是一个搜索索引。但是,想要重新获得那个核心能力就很难了,你已经失去了它。我认为对我们来说,更多的是一个问题:我们在业务中需要哪些核心能力?是的,有时这是痛苦的有时候实际上这些核心能力确实会令人烦恼,有时我们会落后于外界现有的水平,我们只需要非常诚实,这就是公司追求真理的重要性所在。我们是否真的对这项核心能力诚实?我们真的能跟上吗?如果答案是我们确实无法跟上,那么为什么还要继续这种虚假表演呢?我们应该直接购买。如果答案是我们能够做到,而且我们认为从长远来看这将使我们的公司变得更好,那么我们就需要这样做,因为比赛不是在明年就能赢得的,而是在未来五到十年,甚至更长时间内赢得的。这可能是一个方面。 然后第二点,从企业的角度来看,我认为公司现在独特之处在于我们同时拥有个人和企业用户,通常公司只专注于其中一个。我认为这需要成为公司 DNA 的一部分。正如 Anshul 所说,早期公司就是这样,比如 Dropbox 等公司的故事。Dropbox 是一家了不起的公司,是有史以来增长最快的消费软件公司之一。但是,当所有人都专注于消费者方面时,企业端就只是在完成一系列对消费者毫无帮助的任务,这不会帮助你的增长指标。事实上,如果最初的那群人不在乎,那么后来让他们在意就变得极其困难。为什么要这样做呢?你需要感觉到这对公司的生存能力很重要。所以我认为有一点是关于自建还是购买的问题,另一点是关于公司的文化 DNA,我认为这两点都非常重要。是的,这是我们一直在思考的问题一直;总是;始终


我有幸在私下里和你们成为朋友。我觉得我了解你们的工作经历,就像你说的文化 DNA,但你们并没有之前建立过巨大的企业级 SaaS,对吧?是的,我想是这样。那么你们是从哪里获得这些见解的呢?


事实上,我认为当我回顾我之前的实习经历时,也许 Anshul 可以在这里提供一些背景,我曾在 LinkedIn、Quora 和 Databricks 工作过。老实说,我对 B2B ETL 软件并不是那么感兴趣,这不是驱使我夜里醒来的动力。因此,我决定在毕业后立即去一家自动驾驶汽车公司工作。我认为部分原因在于公司的独特性,以及我们作为一家公司进行了转型,我们希望成为一家持久的公司,然后问题是如何从这个目标反向推导。 我们需要非常诚实地面对我们擅长和不擅长的领域。比如说,令人惊讶的是,企业销售并不是我与生俱来就会的技能,我一开始并不真正了解。因此,显然很多销售是通过像 Anshul 和我这样的人与公司合作来完成的,但很快我们就聘请了一位销售副总裁,我们实际上深度参与了扩大大规模市场团队的过程。 我认为更多的是关于什么对公司重要,以及如何真正去建立它。我经常想到的一个人是 Alex Wang,他从麻省理工学院辍学,比我们小一岁。他已经弄清楚了如何不断有效地改变公司的方向。公司最初是一个人工任务界面,然后是一家自动驾驶标注公司,接着是一家目录公司,现在是一家生成式 AI 标注公司。每一次转型,公司的收入都会增长约 10 倍,尽管业务在做的事情基本上不同


现在一切都与军事合同有关


Varun : 是的,现在可能会是军事方面,之后可能就是统治世界了,他只会不断提高赌注,而且对于这种情况并没有现成的操作手册,这只是有点像你知道的,解决一个困难的问题,然后从结果往回推,从那里往回推,对吧?


Anshul : 我们在过程中会有些运气。我不认为像你那样从第一原理出发思考所有事情是我们能力所及的,因为有太多变量和未知因素。是的,我们并不了解每家公司正在发生的所有事情,而且每个人都知道 AI 领域发展得有多快,所以我们必须非常善于适应


我想重点强调一件事,因为你提到了它,而且这是一个很少触及的话题——VPO 销售。我们通常与相当早期的创始人交谈,他们通常还没有建立完善的销售职能。你能分享一下在这个领域什么样的销售方式有效,什么无效,以及任何可以与其他创始人分享的经验吗?


Varun : 我认为招聘销售人员的一个难点,我真的很喜欢 Graham Unschul 也可以证明,我们公司有很棒的销售副总裁。其中一个问题是,如果你纯粹招聘开发人员做销售,他们的工作就是说话非常得体优雅。我的意思是,很明显,如果你听我说话,我不是一个很有修养的人。顺便说一句,你很棒,我不知道与大多数纯粹的销售人员相比如何。所以实际上仅仅根据他们说话的方式来判断并不那么有趣。我认为,在像我们这样快速发展的领域,重要的是智力好奇心和智力能力,理解如何建立一个工厂。我并不是想贬低它,但在某些方面,你需要在这里建立一些非常可扩展的东西,对吧?这几乎就像每年你都在让这个工厂扩大两倍、三倍,因为在某些方面,你有配额承担的人,你需要一定数量的人,你需要让数学计算成立。实际上,建立工厂的过程不是你需要做的事情,你可以只是找一个在其他公司表现出色的销售代表,让他们来建立工厂。这实际上是一个非常不同的技能,如何确保你有数百人真正深入理解产品。实际上,Unshul 也与销售部门密切合作,确保他们得到适当的支持,确保他们理解技术。我们的技术也在快速变化。让我们举个例子,说明我们公司与 MongoDB 这样的公司有何不同。当你销售 MongoDB 这样的产品时,公司里没有人对数据如何存储感兴趣,这并不有趣,对吧?我喜欢数据库,我会感兴趣,但大多数人只是想解决手头的应用问题。人们对我们的技术如何运作很好奇,人们对但是正确的人购买我们的技术,想象一下我们有一个正在扩大规模的销售团队,但没有人理解这些东西,我们就无法成为客户的优秀合作伙伴。那么,你如何创建一个几乎是不断成长的工厂,能够以忠实于我们合作伙伴的方式分发软件,同时还能接纳我们产品的所有新部分呢?就像他们实际上能够阐述我们产品的新部分。抱歉,这更像是一个问题,更像是一个关于建立可扩展销售团队的陈述。但就你雇佣的人而言,你只需要有一种感觉,在某些方面,这可能是一个例子,就是与足够多的人交谈,找出在你的类别中什么是好的,然后找到一个优秀、谦逊并愿意与你合作的人。是的,这只是一般的招聘建议


Swyx : 我认为这里只是一般的招聘,有针对 AI 或 AI 基础设施的销售岗位。然后还有我们刚才讨论的那种销售反馈到产品的方式,他们基本上会告诉你他们需要什么。我想这种情况经常发生


我认为很多这样的事情确实发生了,我的意思是现在仍然存在。Varun 提到过,像 Varun、我自己以及其他一些本行是开发人员的工程师,我们都相当深入地参与到销售过程中,因为有很多东西需要学习。在我们出去雇佣一个销售主管之前,是的,如果我们只是这样做的话,我们两个人都从未为 Codeium 做过任何销售,如果我们就这样去寻找一个销售主管,我们可能就不会雇到合适的人


Varun : 是的,那时我们已经向大约 30 或 40 个客户销售了一款产品


Anshul : 就像我们自己亲自完成了数百次交易周期一样,对吧?我们没有读过很多书,只是做了很多事情,然后我们学到了哪些信息传递方式有效,我们需要做什么。然后我认为我们找到了合适的人,第二个是 Varun,比如 Graham 就很棒,我们聘请他作为销售副总裁,这必须是本质的一部分。而且现在也不会停止,就算我们有了销售副总裁和专门负责销售的人员,也不意味着我们不能参与,或者工程团队不能参与,对吧?我们有很多人,我们雇佣了很多部署工程师,这些人你知道的,我觉得 Palantir 让这个角色变得非常有名,就是部署工程师与销售团队在非常技术性的方面密切合作,因为他们也能理解人们试图用 AI 做什么


Swyx : 就是说他们作为部署工程师在 Codeium 工作,是的,好的


Anshul : 然后他们与我们的客户经理合作,让我们的客户获得成功,并了解人们实际上从 AI 中获得了什么价值,对吧。我们不断收集这些信息,我们俩都会投入到任何交易周期中,只是为了学习更多,因为这就是我们将继续构建最佳方法和最佳产品的方式。这又回到了同样的观点:只是关心,我不知道,希望我们能构建正确的东西


很棒伙计们,谢谢你们抽出时间,很高兴再次在播客上见到你们


Varun : 是的,非常感谢邀请我们。希望一年后我们能再做一次


Swyx : 到那时你将价值 100 亿美元


文章来自于“AI 超级川”,作者“南川同学”。


Windsurf:如何构建企业级 AI IDE(两万字)

关键词: AI , Windsurf , AI IDE , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

6
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner