图片来源:Unsplash
AI 开发者之所以一致认为编程的重要性,是有原因的:大型语言模型编程能力越强,它回答与软件无关的其他类型问题的能力也越强。
去年秋天,几位 Google 人工智能领导者与初创公司 CEO Jonathan Siddharth 会面,该公司按需出售兼职软件工程师的服务。
谷歌的管理人员询问 Siddharth ,初创公司 Turing 是否可以利用其庞大的程序员团队来教谷歌的人工智能更好地完成编码任务,听到讨论的人表示。这样做需要 500、800 还是 1,000 名程序员,他们能多快开始?
谷歌员工们很着急。他们得知 OpenAI 已经使用 Turing 的编码器来审核和提升其 AI 模型的编程能力超过一年。而且谷歌员工们也知道 OpenAI 的聊天机器人吸引了数百万付费客户,其中许多是软件工程师,他们使用它来编写或检查代码。
据 The Information 报道,Turing 预计今年收入将翻倍,达到每月约 2000 万美元的总收入,或每年 2.4 亿美元的速度,这些数据包括初创公司支付给承包商的收入部分。
谷歌最终与 Turing 达成了一项数百万美元的协议。正如它对 OpenAI 所做的那样,Turing 在接下来的六个月里动用了超过 500 名程序员来评估谷歌的模型在数千个编码任务上的表现。根据一位了解情况的股东的说法,自那时以来,谷歌与Turing 的支出有所增加,尽管无法得知谷歌的聊天机器人在这项工作后编码能力的具体提升程度。
随着 OpenAI 及其竞争对手竞相推出能够自动化白领工作的庞大语言模型,编码已成为该技术最实用和最有利可图的应用。因此,大约两打LLM开发者,包括 Anthropic、Microsoft 和 xAI 等主要公司,已与 Turing 合作,另一位股东表示,他见过客户的名称。客户的发言人没有发表评论。
有一个原因使得人工智能开发者们一致认为编码的重要性:一个LLM 编码得越好,它就能更好地回答与软件无关的其他类型问题。
“对编程进行模型训练有助于它们更加严谨地回答问题,并在许多不同领域进行推理,”Meta Platforms 首席执行官马克·扎克伯格在今年早些时候的一档播客中说道。Meta 也是 Turing 的客户。
OpenAI 和 Anthropic 尤其在 AI 编程的霸主地位上展开激烈竞争,而 ChatGPT 的制造商正在开发一种产品,以自动化可能需要人类花费数小时或数天的软件工程任务。
Turing 是几家关键公司之一,包括 Scale AI 和 Surge AI,这些公司为全球最大的对话式人工智能开发者提供能够提升其产品的熟练承包商。在这些公司中,Scale 获得了最多的关注,因为它是 OpenAI 的第一大人类评估者供应商,早于 ChatGPT 几年的时间。Scale 最初雇佣的是海外低薪工人,但越来越多地雇佣专业作家、医生和律师来评估聊天机器人回答—— Turing 也在采取这一举措。
Turing 旨在利用其代码评估业务实现其最初的使命,成为像埃森哲或波士顿咨询集团这样的咨询公司的更便宜、更好的版本,这些公司为企业提供特定项目的软件工程师。
咨询公司因客户寻求新人工智能的帮助而蓬勃发展。例如,埃森哲表示,在截至 8 月 31 日的 12 个月中,其生成式人工智能的收入达到了 9 亿美元,而在前一个财政年度为 1 亿美元,并且在刚刚结束的财政季度中预订了 10 亿美元的新生成式人工智能相关业务。然而,整体收入与去年同期相比仅增长了 3%。
与此同时,Turing 预计今年收入将翻倍,达到每月约 2000 万美元的总收入,或每年 2.4 亿美元的速度,据一位有数据访问权限的人士透露,这些数据包括初创公司支付给承包商的收入部分。该公司拥有 850 名员工,这位人士表示,在第二季度首次产生了自由现金流。(相比之下,Scale 在上半年收入增长了四倍,达到 4 亿美元,第二季度的自由现金流利润率为负 26%。)
大约 60%的 Turing 收入来自与人工智能开发者合作以改善他们的模型。其余 40%的收入来自更传统的来源,例如像百事可乐、迪士尼和沃尔沃这样的企业,他们需要人类程序员来帮助他们构建移动应用或分析。
最新类型的承包商被 Turing 和 Scale 雇佣,预示着人工智能的未来。Siddharth 表示,Turing 最近已超越编程,现还提供能够评估模型在市场营销、数学、金融和医疗领域表现的专业人士。这意味着主要的人工智能开发者正在尝试在这些行业中自动化任务。
“我们正在将人类的知识转化为机器的知识,以便[人工智能]能够随着时间的推移进行扩展,”Siddharth 说。“每个角色、每个行业中的每个职能都有一系列可以自动化的工作流程”,因为它们涉及数据分析,而这正是人工智能擅长的领域,”他说。
另一个 Turing 的热门领域是训练人工智能模型以人类的方式使用计算机,这项技术被称为计算机使用代理。OpenAI、Anthropic 等公司正在开发这些代理,以帮助人们完成涉及桌面应用程序或网页浏览器的复杂或繁琐的任务。
在帮助人工智能开发者开辟新领域的同时,Turing 和 Scale 分别希望利用他们对人工智能模型优缺点的理解,帮助商业客户开发使用人工智能的应用程序,以执行类似于传统咨询公司的工作。
例如,Agora 提供视频会议和音频会议,向Turing 支付了数十万美元,以帮助使用谷歌的人工智能开发编程助手和聊天机器人。产品总监威廉·陈表示,这个聊天机器人可以回答销售人员关于 Agora 产品的问题以及客户的技术支持问题。
陈说:“Turing ‘帮助我们塑造产品组合,并更好地理解生成式人工智能技术栈’,并补充道,Turing ‘像一个咨询合作伙伴,为我们生成代码’。”
Scale 的服务业务发展得更为成熟;它预计今年将从提供此类服务中获得超过 2 亿美元的收入。
咨询公司通常以低于软件企业的收入倍数进行估值,因为它们的利润率往往较低。但 Sumir Chadha 表示,他的风险投资公司 Westbridge Capital 向 Turing 投资了超过 1 亿美元,他认为这家初创公司应该获得更高的估值,因为与现有企业相比,它的间接成本相对较低。
咨询公司“拥有大量土地和建筑,并且在人力资源和销售方面有成千上万的人”,查达说。相比之下,Turing 公司远程运营,没有固定办公室,其软件程序员可以在一两天内为客户开始工作——这个时间比大型咨询公司要短。
Turing 在 2021 年底的一轮融资中估值为 11 亿美元,最近内部估值约为 20 亿美元,或其年化收入的 10 倍。这意味着按收入倍数计算,它的估值至少是一些最大的咨询公司的两倍。
40 岁的 Siddharth 出生于印度的钦奈附近,在人工智能领域有着悠久的历史。他在斯坦福大学获得了计算机科学的研究生学位,专攻人工智能,随后在 Powerset 担任软件工程师,该公司是一家使用自然语言处理的搜索引擎,是大型语言模型的前身。微软于 2008 年收购了 Powerset。
OpenAI 首席执行官萨姆·阿尔特曼(左)和Turing 首席执行 Siddharth。图片来源:Turing
他在 2018 年共同创办了Turing ,因为在经营一家内容推荐初创公司时,他发现很难在旧金山湾区招聘当地程序员。发言人表示,他在 2017 年以 3000 万美元的现金和股票将后者的业务出售给了另一家公司。
到那时,他得出结论,优秀的软件程序员在全球范围内都可以找到,并且可以以当地程序员成本的一小部分为美国公司工作。Turing 开发了一种自动化测试,以评估印度、巴基斯坦、巴西和阿根廷等国数百万程序员的质量,他说“他们的智慧被浪费了”,因为缺乏经济机会。
新冠疫情封锁催化了Turing 的业务。随后,OpenAI 出现了。
在 2022 年推出 ChatGPT 的几个月前,这家人工智能公司询问Turing 是否可以评估其模型在 Java、Swift 和 Python 等语言上的编程能力。
一个Turing 工作者有时会花一到两个小时评估模型根据一种指令生成代码的方式。人类评估者通常会写下模型可以或应该做得不同的描述。
这项工作是 Siddharth 所称的“人工智能的黑暗艺术”的一部分,称为后训练,这是一个持续数月的阶段,在此期间,人类测试人工智能模型,以找出其最佳和最差部分,并在公开发布之前进行调整。
在Turing 与 OpenAI 合作后,ChatGPT 成为程序员们的福音,他们利用它更快地完成工作。
但直到谷歌来找他,西达尔才意识到人工智能编程可以帮助模型做的不仅仅是解决编码问题。
与谷歌合作,包括 2023 年末的假期,就像是“圣诞老人的工厂,一个关键时刻……我们知道我们所做的工作是多么重要。这让我们变得更加坚定,” Siddharth 说。
他后来告诉股东,谷歌的交易代表了一个转折点,Turing 在接下来的一年里可以将收入翻倍,一位当时与他交谈的股东说。这个预测最终被证明是正确的。
Anthropic 在谷歌之后不久就开始与Turing 合作。股东表示,今年其他竞争对手也跟进了。
本文翻译自:The Information,https://www.theinformation.com/articles/the-startup-fueling-openai-and-anthropics-coding-race?rc=pbvtni
编译:ChatGPT
文章来自于微信公众号“Z Potentials”,作者“The Information”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/