图片来源:Unsplash
在 Reddit AMA中,OpenAI 首席执行官萨姆·奥特曼承认,计算能力不足是阻碍公司频繁推出产品的一个主要因素。
“所有这些模型变得相当复杂,”他在回应关于为什么 OpenAI 的下一个 AI 模型需要这么长时间的问题时写道。“我们还面临许多限制和艰难的决定,关于我们如何将计算资源分配给许多伟大的想法。”
许多报告表明,OpenAI 在确保足够的计算基础设施以运行和训练其生成模型方面遇到了困难。就在本周,路透社援引消息来源表示,OpenAI 已经与博通合作了数月,致力于开发用于运行模型的人工智能芯片,该芯片可能最早在 2026 年问世。
部分原因是产能紧张,奥特曼表示,OpenAI 的 ChatGPT 的逼真对话功能高级语音模式,不会很快获得在四月首次透露的视觉能力。在四月的新闻发布会上,OpenAI 展示 了在智能手机上运行的 ChatGPT 应用,并根据手机摄像头视野内的视觉线索(例如某人穿着的衣服)作出回应。
报告来自《财富》的消息后来透露,演示是匆忙进行的,以转移人们对谷歌 I/O 开发者大会的注意,该大会在同一周举行。OpenAI 内部的许多人认为 GPT-4o 还没有准备好被揭示——值得注意的是,先进语音模式的仅语音版本被推迟了几个月。
在 AMA 中,奥特曼表示,OpenAI 的图像生成器DALL-E的下一个重大版本没有发布时间表。(“我们还没有发布计划,”他说。)与此同时,OpenAI 的视频生成工具Sora因“需要完善模型、确保安全/防止冒充/其他事项,以及扩展计算能力”而被推迟,OpenAI 的首席产品官凯文·韦尔在参与 AMA 时写道。
Sora reportedly 遭遇了技术上的挫折,使其在与 Luma、Runway 等竞争系统的对比中处于劣势。根据《信息》报道,原始系统在 2 月份揭示,制作一个 1 分钟的视频剪辑需要超过 10 分钟的处理时间。
在十月,Sora 的联合负责人之一,Tim Brooks,离开了谷歌。
在 AMA 的后期,奥特曼表示,OpenAI 仍在考虑在 ChatGPT 中“某天”允许“NSFW”内容(“我们完全相信以成人的方式对待成年用户,”他写道),并且公司的首要任务是改进其o1系列“推理”模型及其后续版本。OpenAI 预览了本周在伦敦的 DevDay 会议上即将推出的多个 o1 功能,包括图像理解。
“我们今年晚些时候会有一些非常好的发布,”奥特曼写道。“不过我们不会称之为 GPT-5。”
文章来自于“Z Potentials”,作者“ChatGPT”。