OpenAI 传说中的「Strawberry(草莓)」模型终于要来了。
据外媒 The Information 报道,随着 OpenAI 不断筹集更多资金,其研究人员正在尝试推出一款新的 AI 产品,预计这款产品在解决复杂问题的能力上将超越现有的 AI。
据两名参与该项目的知情人士透露,研究人员计划在今年秋季推出这款内部代号为 「草莓」 的新 AI(此前称为 Q*,发音为 Q Star),它可能会作为 ChatGPT 的一部分功能推出。
「草莓」可以解决此前从未见过的数学问题,这是目前的聊天机器人无法做到的,并且还经过训练能够解决与编程相关的问题。
但这款 AI 的功能并不仅限于技术问题的解答,如果给「草莓」模型更多的「思考」时间,它还能回答客户关于更主观话题的问题,例如产品营销策略。
据悉,为了展示「草莓」在语言任务方面的强大能力,OpenAI 员工还曾展示过它如何解出《纽约时报》「Connections」 这一复杂文字谜题。
报道称,这项技术对未来 AI 产品,特别是旨在解决多步骤任务的智能体,具有重要意义。其中 OpenAI 及其竞争对手目前正在希望通过这些智能体来开辟更多的收入机会。
目前 OpenAI 的业务正在迅猛增长。
尽管其每月支出可能比这一数字还要高,但 OpenAI 向企业销售的大语言模型和 ChatGPT 订阅服务的月收入已较去年增长了近三倍,达到了 2.83 亿美元。
目前,OpenAI 的估值已经达到 860 亿美元。 然而报道指出,OpenAI 的未来在一定程度上取决于其正在开发代号为 Orion 的新旗舰大语言模型。
据悉,这个模型旨在改进其去年早些时候推出的现有旗舰大语言模型 GPT-4。到目前为止,其他竞争对手已经推出了在性能上与 GPT-4 相当的大语言模型。
不过,报道也指出,尚不确定 OpenAI 是否能在今年推出「草莓」聊天机器人版本,这个版本是原始「草莓」模型的简化版,称为蒸馏版。它旨在在保持高性能的同时,操作更为简便且成本更低。
知情人士表示,OpenAI 还在利用「草莓」的更大版本生成用于训练 Orion 的数据。这种 AI 生成的数据被称为「合成数据」。
这意味着「草莓」可能帮助 OpenAI 缓解从互联网获取高质量训练数据的挑战。
此外,这位知情人士还表示,「草莓」可能有助于即将推出的 OpenAI 智能体减少幻觉。
Minion AI 的 CEO 兼 GitHub Copilot 前首席架构师 Alex Graveley 表示,使用「草莓」生成更高质量的训练数据可能有助于 OpenAI 减少其模型产生的 AI 幻觉。
Graveley 进一步解释道:「想象一下『没有幻觉的模型』,你问它一个逻辑难题,它第一次就答对了。」 之所以能够做到这一点,是因为 「训练数据中的模糊性更少,因此它的猜测更少。」
本月早些时候,OpenAI CEO Sam Altman 在 X 平台上发布了一张草莓的图片,但没有作出详细说明,引发了全网大猜测。
而知情人士表示,今年夏天,OpenAI 还向美国国家安全官员展示了「草莓」模型。
「我们认为这次模型所需的数据已经足够,」 Altman 在五月份的一次活动中说,这很可能是指 Orion。「我们进行了各种实验,包括生成合成数据。」
目前,他还在努力为公司筹集更多资金并寻找减少亏损的方法。据知情人士透露,自 2019 年以来,OpenAI 已从微软筹集了约 130 亿美元,作为与这家软件巨头合作的一部分,合同将持续到 2030 年。
这位知情人士还表示,合作条款可能会发生变化,包括 OpenAI 如何支付租用云服务器以开发其 AI 的费用,毕竟云服务器是 OpenAI 最大的成本来源。
截至发稿前,OpenAI 的发言人对此报道未予置评。
路透社此前也曾报道了草莓的名称及其推理能力。业界普遍认为,一个能够解决复杂数学问题的 AI 可能是一个具有潜在利润的应用领域,因为现有的 AI 在航空航天和结构工程等数学密集型领域表现不佳。
不少 AI 研究人员也发现对话式 AI,如 ChatGPT 及其同类产品容易给出错误答案,包括前一段时间爆火 9.11 和 9.8 比大小的难题也难倒了不少聊天机器人。
此外,数学推理的改进还可能帮助 AI 模型在推理对话查询方面表现更佳,例如处理客户服务请求。
据悉,Google 和一些 AI 初创公司也在努力开发推理技术。上个月,Google DeepMind 表示,其 AI 将击败国际数学奥林匹克竞赛中的大多数人类参与者。
OpenAI 劲敌 Anthropic 此前表示,得益于其推理能力的提升,其最新的大语言模型能够编写比之前的大语言模型更复杂的软件代码,并回答有关图表和图形的问题。
为了提高模型的推理能力,一些 AI 初创公司一直在使用一种「讨巧」的方式,即将问题分解为更小的步骤,而代价就是这些解决方法速度慢且成本高。
外媒指出,无论草莓是否作为产品发布,人们对 Orion 的期望都很高,因为 OpenAI 希望继续领先于竞争对手,并保持其显著的收入增长。
有意思的是,草莓的诞生还与前 OpenAI 首席科学家 Ilya Sutskeve 扯上了关系。
据悉,几年前,正是由时任 OpenAI 首席科学家的 Ilya Sutskever 启动了对「草莓」模型的研究。 只不过 Ilya最近 宣布从 OpenAI 离职,并创办了新公司「安全超级智能」(Safe SuperIntelligence,SSI)。
在他离开之前,OpenAI 的研究人员 Jakub Pachocki 和 Szymon Sidor 基于 Sutskever 的工作开发了一种新的数学求解模型 Q*,这引发了一些关注 AI 安全的研究人员的担忧。
在 Q* 的开发过程中,OpenAI 的研究人员还开发了一种被称为「测试时计算」(test-time computation)的概念变体,旨在提升大语言模型的解题能力。
该方法使模型有机会花更多时间考虑用户命令或问题的所有部分。当时,Sutskever 还发表了一篇与这项工作相关的博客文章。
接下来,OpenAI 将继续全力推动「草莓」的发布,以保持其在 AI 领域的领先地位,并应对来自其他公司的激烈竞争。
与此同时,Orion 作为 OpenAI 下一个重要的大语言模型,肩负着公司未来发展的重任,其表现将对 OpenAI 的长期前景产生深远影响。
值得注意的是,随着 OpenAI 等公司在 AI 领域的不断突破,业界对 AI 安全性问题的关注也在日益增加。
特别是在 AI 技术逐步向更复杂的推理能力迈进的背景下,「草莓」和 Q* 的开发过程引发了关于 AI 伦理和安全的广泛讨论。
基于此,OpenAI 以及整个 AI 行业所面临的挑战,不仅在于技术层面的突破,还在于如何平衡创新与安全之间的关系。
未来,随着更多类似「草莓」这样的 AI 产品的推出,AI 的发展方向将更加多样化,也将对社会各方面带来更大的影响。
但不管怎么说,「草莓」的推出将标志着 OpenAI 在 AI 推理能力方面的又一次重要进步。无论是对现有的 GPT-4 进行改进,还是为未来的 Orion 模型提供支持,「草莓」都将发挥关键作用。
附上报道原文地址:https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion
文章来源“APPSO”,作者“APPSO”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md