OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破
6864点击    2025-12-01 10:03

OpenAI,亟需一场翻身仗!今天,全网最大的爆料:GPT-5基石实为GPT-4o。自4o发布之后,内部预训练屡屡受挫,几乎沦为「弃子」。


OpenAI核心预训练,接连翻车?


传言称,GPT-5的基石仍是GPT-4o,且GPT-4.5之后的预训练版本,都被OpenAI放弃了!


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


这么说并非空穴来风,核心爆料恰恰来自权威SemiAnalysis的最新一文——


OpenAI顶尖团队自GPT-4o发布之后,迄今尚未完成一次完整的,为下一代前沿模型设计的大规模预训练。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


文章中,高级分析师强调:谷歌正手持TPUv7这把利剑,向英伟达王座发起冲锋,或将终结CUDA护城河。


众所周知,OpenAI全栈模型是在纯英伟达GPU上炼出的。


然而,圈内人的焦点,大都放在了大模型「推理」和「后训练」的硬件之上。


殊不知,没有前沿模型的预训练,一切皆是「无米之炊」。恰恰这一环节,成为了AI硬件里最难、最耗资源的一关。


如今,一个不为人知的内幕爆出了:


事实证明,谷歌TPU彻底经受住了这一考验; 


相较之下,自2024年5月GPT-4o诞生之后,OpenAI的预训练却毫无进展.....


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


过去,两年半的时间,OpenAI没有真正Scaling预训练的规模


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


GPT的预训练,或许在GPT-4o之后触及了天花板,由此也解释了GPT-5性能未达业界预期的关键原因。


有网友表示,那不正是Ilya离开的时候吗.....


恰在昨天,Ilya最新发文称,Scaling不会停,但某个重要的东西仍然会缺失。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI预训练,大溃败


还记得去年底,那场铺天盖地的「Orion」传闻吗?


这一秘密项目,原定以GPT-5面世,但因训练未达预期,最终被降级为GPT-4.5发布


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


在前沿模型预训练上,OpenAI的研发似乎陷入了僵局——


如今第五代旗舰模型GPT-5,包括最新GPT-5.1,其「技术根基」本质或仍未突破GPT-4o的范畴。


SemiAnalysis去年底一篇文章,曾对外公开了Orion训练的困境。


当前,算法的进步使得模型每年所需的物理计算量减少约三分之一,因此,训练运行时间很少超过3个月。


甚至,行业中大多数预训练通常仅需要1-2个月。


然而,OpenAI的Orion大规模预训练,却打破了这一常规,其训练时间超过了3个月。


另据Information同一时间爆出,Orion不会像前代实现巨大的飞跃,相较于从GPT-3到GPT-4的迭代,改进幅度要小得多。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


不仅如此,Orion性能提升也基本局限在——语言能力上,其代码能力甚至不如旧模型,且成本更高。


如今再回看2月,GPT-4.5的诞生,基于代号Orion的模型,OpenAI追求的是:


更强的语言能力+更稳的对话体验+更大知识库


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


情商,成为了GPT-4.5的关键词。代码虽有提升,但并非主菜。


这一切的一切,从侧面印证了,此前外媒关于「Orion遇挫」爆料的准确性——


LLM有提升,但不大。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


GPT-4o,成Scaling主线?


今年8月,GPT-5的那场发布,奥特曼将其定调为「博士级AI,是通往AGI又一里程碑」。


实则,业界对于GPT-5的反响,唏嘘一片。


大家原本以为,GPT-5会是全面超越前代的一次飞跃,但实际发布后,更像是GPT-4.5的进一步优化版,不是「颠覆版」。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


但至于GPT-5真正基于哪一款GPT打造,还有待证实。


正如之前传闻的猜测,有可能是GPT-4o,还有Reddit网友称是GPT-4.1....


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


但不论是哪一款,都证明了GPT-5,没有在全新前沿模型的大规模预训练上淬炼。


搞笑的,那个曾将OpenAI三颗🍓🍓🍓「焊在」名字中的大佬,如今改成了三个🍌🍌🍌。


他表示,这已经不是什么秘密了——


GPT-4.5将预训练推向极致之后,OpenAI加倍投入了推理范式,主打o系列+RL。


不同的是,谷歌和Anthropic仍在Scaling预训练,并增强了强化学习。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI主动放弃了这一范式,为劲敌让出了一条速通道。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


奥特曼:这事儿瞒不住了!


Gemini 3发布后,谷歌和OpenAI攻守之势易形——


Gemini 3来势汹汹,而OpenAI这次终于坐不住了!


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


据泄露的内部备忘录,奥特曼坦言:「近期, 从各方面来看,谷歌在大语言模型表现出色」,特别是预训练。


这番表态标志OpenAI的重大转变——它终于承认,一个重新崛起的竞争对手与逐渐降温的企业需求,已彻底打破了其「天下无敌」的光环。


所谓预训练,是训练生成式AI模型(无论是文本还是图像)过程中的第一阶段。在这一阶段,研究人员会用网页等大量数据「投喂」模型,让它掌握数据之间的各种关联。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破

大语言模型(LLM)开发与训练流程概述:预训练和后训练是关键


在预训练领域,谷歌取得了新突破,给Gemini 3带来了空前的推理深度。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


这让不少AI研究者颇感意外——


毕竟,OpenAI去年曾屡屡碰壁,而谷歌自己过去也曾陷入瓶颈。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


正因如此,在一段时间内,OpenAI选择将更多精力转向另一种新型AI架构——「推理模型」,这种模型虽然计算量更大,但有望输出更优质的回答。


在推出GPT-5之前,OpenAI团队曾尝试对预训练阶段做出一系列调整,这些方法在小模型上有效,一旦模型变大就失效了。


GPT-5发布第二天,西班牙与波兰Talan公司AI应用负责人Javier Alba de Alba表示:


(GPT-5)整体观感颇为失望: 


这是个优秀的模型——响应迅捷、价格亲民、能力全面,但远非人们基于OpenAI过往发布会所预期的代际飞跃。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


GPT-5带来了不少提升——


编程能力显著提升、推理能力进阶、幻觉现象减少、医疗领域表现优化,甚至免费用户也享有更长的默认使用时长。此外命名体系全面简化:GPT-4o/4.1/turbo/mini等繁杂名称悉数消失,统一更名为GPT-5。


不过,Javier Alba de Alba提醒:「千万不要被名称迷惑:GPT-5并非新一代产品。」他解释道:


技术层面而言,它更像是GPT-4o的功能增强版,即便命名为GPT-4.2也毫不违和。 


OpenAI此举虽完成了必要的名称统一,但整场发布会未能达到预期,让技术社区颇感失落。


GPT-5发布后,Epoch AI也发现了其中的异常:


相比前代GPT-4.5,GPT-5很可能消耗了更少的训练算力。


虽然具体数值尚未公开,但GPT-4.5使用的训练算力极有可能超过GPT-5。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


预训练并未消亡,它依然是胜负关键。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


在内部会议中,奥特曼鼓舞士气,称在未来几个月,OpenAI将重新夺回优势。其中关键举措之一,就是打造一款代号为「Shallotpeat」的新一代大语言模型。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


据知情人士透露,该模型的设计目标之一,就是专门修复OpenAI在预训练过程中遇到的种种「疑难杂症」。


OpenAI:内部的风向变了


GPT-5发布的实质是什么?


对现有ChatGPT用户而言,GPT-5是个好消息,但这并未开启新时代。


它只是进化历程中的一小步,而非革命性飞跃。


既然更多算力通常意味着更强性能,为何OpenAI会反其道而行?这对未来模型发展意味着什么?


在与a16z合伙人Martin Casado对话中,OpenAI平台工程负责人Sherwin Wu,深度拆解了OpenAI当前平台架构、定价逻辑与未来方向。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


在这次访谈中,他们深入探讨了为何开发者往往会长期依赖某个「值得信赖」的模型系列,信任感是如何建立的,以及为什么行业已经逐步放弃了「一个模型通吃所有任务」的幻想。


Sherwin还讲解了从提示词工程到上下文设计的演变过程,以及企业如何借助OpenAI的微调(fine-tuning)和RFT API,利用自有数据定制模型行为。


共识已变


几年前,OpenAI内部认为:未来会有一个「统治一切」的超级模型。但现在行业共识已经转变为「模型的专业化和多样化」。


虽然会有强大的通用模型,但也需要针对特定任务(如编程Codex、视频Sora)的专用模型。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


文本、图像、视频背后的技术堆栈各不同。目前,在后台。这些模型往往是分开优化的独立系统,很难简单地「一锅炖」。


顺便提一句,正是DALL-E 2的出现让Sherwin决定加入OpenAI,因为那是他第一次感受到AI的魔力。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


而微调(Fine-tuning)也悄然进化——


早期的微调,主要用于调整「语气」或「指令遵循」。 现在的重头戏,是强化学习微调(Reinforcement Fine-Tuning) 。


这允许企业利用其庞大的专有数据(Data Treasure Troves),将较小的模型在特定领域训练至SOTA水平。这是解锁企业数据的关键。


也就是说,企业拥有大量内部数据,但与ChatGPT「毫无关系」,对企业专属AI而言却是黄金。


他们多次提到AI代码编辑器Cursor作为建立在 OpenAI API 之上的成功产品案例,证明了:


即使OpenAI自己有竞品,开发者依然可以建立伟大的垂直应用。


Agent开发模式


从第一天起,奥特曼和Greg Brockman就确立了「App+ API」的双轨战略。


这样做是为了尽可能广泛地分发AGI的利益——


如果只做 API,你就无法触达普通消费者;如果只做应用,你就无法赋能各行各业的开发者。


在这次对话中,他们重点谈论了智能体开发工具「Agent Builder」。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


Sherwin认为,智能体(Agent)并非一种全新的模态,而是AI的一种新使用方式。


本质上,智能体是一个能够代表用户、在较长的时间跨度(Long Time Horizons)内执行一系列操作并完成任务的AI系统。


OpenAI曾推出了可视化的「Agent Builder」(节点式构建),但发现对于开发者而言,这种方式可能过于受限。


访谈中,Sherwin和Martin将智能体清晰地划分为两类,这解释了为什么目前市面上的Agent产品形态各异——


  • 探索型/非定向工作 (Undirected/Exploratory Work)
  • 流程型/SOP导向工作 (Procedural/SOP-oriented Work)


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


在对话中,第二类Agent开发可能更像传统的软件工程或游戏开发中的NPC(非玩家角色)逻辑


与其让模型完全自由发挥,不如通过代码给予它明确的逻辑框架和标准操作程序(SOP),特别是在受监管的行业(如客户支持、金融)。


也就是说,逻辑必须写死在代码里,而不是提示词里。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


这就是Agent Builder想要解决的问题:为那些必须控制智能体行为的行业和场景,提供一个简单、清晰、可验证的解决方案。


One More Thing


2025年度压轴大戏,谷歌Gemini 3 Pro无疑打了一场胜仗,但OpenAI不会袖手旁观。


内部已确认,圣诞节前夕,一连串发布连番轰炸。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


据传,一系列新模型,在路上了——


Image Gen v2 


IMO和IOI金牌多模态模型 


GPT-5.2 Codex


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


12月,AI圈一定非常热闹。


OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破


参考资料:

https://www.newsbreak.com/winbuzzer-com-302470011/4359574113974-leaked-memo-sam-altman-sees-rough-vibes-and-economic-headwinds-at-openai  

https://the-decoder.com/as-google-pulls-ahead-openais-comeback-plan-is-codenamed-shallotpeat/ 

https://x.com/jasondeanlee/status/1994616079751286855?s=20 

https://x.com/koltregaskes/status/1994836507694436628?s=20


文章来自于“新智元”,作者 “KingHZ 桃子”。

关键词: AI新闻 , openai , GPT , 奥特曼
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0