GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!
6758点击    2025-10-27 17:35

GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!


近日,有开发者发现,OpenAI 官方在 “openai-agents-js” GitHub 仓库中被提及一个新模型:GPT-5.1 mini 。“显然 GPT-5.1 mini 是真实的……”以下是即将推出的 GPT 模型可能采用的命名规则。


GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!


虽然有网友提到 GPT-5.1 mini 的提及信息已从代码库中移除,但截至发文,下面代码库中仍然可以看到相关消息:https://github.com/openai/openai-agents-js/commit/33935a43a596ad370172f3ec92b712a144a35f8f


目前并不确定这个版本是否会作为单独模型使用,有网友反馈该模型已经被合并。


有开发者称,OpenAI 已经测试了 GPT-5 mini 的新版本。该版本很可能就是为企业账户 “内部知识库” 功能提供支持的模型。在对该模型进行了简单测试后,网友称“其表现优于当前的 GPT-5 mini。”


GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!


“在 GitHub 上查找模型名称就像当一名侦探,只不过是针对人工智能的。OpenAI 的员工们一次又一次地意外泄露了路线图。”有开发者表示。


也有开发者希望,具有高思维能力的 GPT-5- mini 可以作为 GPT-5-Low 的免费无限版本。“性能也应该会更好,同时每个查询(用于加载模型)使用的 GPU 数量也会大大减少。借助新的 Nvidia GPU,查询速度也可以非常快。”


不过也有开发者对此表示质疑,“不确定我们能从单元测试中推断出多少信息。测试代码里很可能存在类似‘期望 gpt-5.0 为 false’或‘期望 gpt-5-v4-agi-final 为 true’这样的内容。”“可能是 Codex 的幻觉。”


GPT-5 系列差评如潮


GPT-5 mini 是 GPT-5 的精简版本,旨在处理轻量级推理任务。OpenAI 称,GPT-5 mini 提供与 GPT-5 相同的指令跟踪和安全调优优势,但延迟和成本更低。根据 OpenAI 官网,一旦免费用户达到 GPT‑5 的使用限制,他们将过渡到 GPT‑5 mini。


发布至今,GPT‑5 mini 最被用户诟病的就是其速度。


有用户表示,“我之前用的是 4.1 mini,因为它延迟低,但实际使用中,GPT-5 系列所有模型在基准测试里都慢了不少。希望 OpenAI 能推出一款新的低延迟模型。对我来说,另一个备选方案就是转用 Ge mini Flash,它速度和 4.1 mini 差不多,但就我的应用场景而言,Ge mini Flash 2.5 的智能程度比不上 4.1 mini。”


“GPT-5 发布的时候我非常兴奋,尤其是 GPT-5 mini,我期待它的性能会比 4.1- mini 更高。但 GPT-5 mini 与 4.1 mini 相比,性能更差、速度更慢,成本也更高。最终我还是选择了 4.1 版本。所有 GPT-5 版本感觉倒退了一步。”有网友称。


“我用 GPT-5 mini 有一段时间了,说实话…… 它几乎在所有方面都比不上 GPT-4.1。它每完成一件事,都非要总结整个对话,这完全拖慢了所有流程。思考的速度慢得让人难受,还经常给出肤浅或毫无意义的回答。至于工具调用,基本没有。它几乎不调用 MCP 服务器或内置工具,即便在明显需要这些工具的时候也是如此。和 GPT-4.1 比起来,它的推理质量和实用性都低得多。”有开发者反馈道。


但也有用户并不觉得 GPT-5 mini 差,“我很久以前就停止使用 GPT 4.1 了,因为它甚至无法处理代码库中非常细微的更改。我尝试用 GPT-5 mini 进行了一些单文件的小修改,效果非常好!没有任何问题,而且速度非常快。”


对于速度问题,有用户称,这是把非推理型模型和推理型模型做对比,推理型模型自然需要更多计算时间,你要么用 “最小化推理”模式来获取最快响应,要么用 “低程度推理”模式 ,响应速度依然够快,同时回答质量能稍好一些;要是 4.1 mini 用着没问题,继续用就好。没有特殊理由的话,没必要特意切换模型。


“我不在乎它是否快,我需要它停止把我当成一个 5 岁的孩子。”还有用户表示。有网友晒出了 GPT-5 mini 荒谬拒绝回答的例子,并称是用的企业级 API 接口。


GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!


在编程方面,GPT-5 mini 表现也不如期待中的那样强。


“作为一名程序员,当我认为任务相对简单时,我会使用 Grok Code Fast1。这 GPT-5 mini 在解释和编写代码方面不太擅长。即使我使用自定义聊天模式(例如 Beast 模式或 Claudette),Grok 的回答质量都比 GPT-5 mini 好。GPT-5 mini 的回答很尴尬,有时看起来像 GPT 3 或 3.5 的早期版本,而且答案的组织相当差。相反,Grok 的答案简洁易懂。我非常喜欢 GPT 4.1,因此我希望 GPT 5 mini 是 GPT 4.1 的更智能版本,但事实并非如此。”有开发者表示。


对此,GitHub Copilot 团队的 bogganpierce 回应称,“我们一直在探索许多快速调整来提高性能,如果 GPT-5 mini 在某些场景下表现不佳,请将它们记录在 vscode repo 上。mini 自然会比 GPT-5 本身的智能化程度更低,但听到 GPT-5 mini 无法执行指令之类的事情时,对我来说这是一个危险信号。我的工作流程是使用 GPT-5 或 Sonnet 4.5 之类的模型进行规划,然后转向 Haiku 或 GPT-5 mini 之类的模型来执行计划,这样的效果似乎很不错。”


不过也有开发者表示,“我日常开发工作就是用 Delphi 开发,GPT 5- mini 运行得很好。难得我们有了一个可以轻松编写 10000 行代码的模型,它写出的代码比 4.1 更好。”


研发不及流量重要了?


在新模型被差评背后,据 The Information 报道,OpenAI 的许多员工感到,这家起源于纯研究实验室的公司,正越来越偏离其起点。


比如,用户参与度(engagement metrics) 成了研发团队的一个关键 KPI。有员工对后训练阶段日益重视“参与度指标”感到不满,他们认为这是一种把产品“增长”指标放在优先位置的信号,是公司越来越像 Meta 的迹象之一。


“我们不想 OpenAI 变成一家靠流量为生的公司。”有在职员工表示。


根据报道,随着前 Meta 员工的大量加入,OpenAI 最近的一些战略和行动,越来越像当初的 Meta。The Information 分析显示,在 LinkedIn 上标注当前雇主为 OpenAI 的人中,约有 630 人曾在 Meta 任职,占 OpenAI 约 3000 名总员工的 20% 左右。这一群体规模庞大,以至于 OpenAI 的 Slack 上专门为前 Meta 员工开设了一个频道。


员工们越发焦虑于 OpenAI 内有大量曾在 Meta 工作的人,公司是否会因此变得越来越像那家社交媒体与数字广告巨头。


今年初,当一些员工抱怨 OpenAI 从 Meta 大量招聘人员时,一个员工主导的工作小组在内部发起了一项调查,询问 OpenAI 的文化是否正变得太像 Meta。该调查(后来扩大范围,问及公司文化是否过于像“大型科技公司”)询问员工是否曾在大厂工作过、其之前工作地点文化的优缺点、以及这些文化是否正在 OpenAI 重现。


想要避免聘用另一家大科技公司的员工几乎不可能:业内具备开发类似 Facebook 或 Instagram 这样规模产品的技术与商业经验的人并不多。


鉴于 Meta 多年来在内容审核、用户隐私、青少年安全等方面的问题,OpenAI 的一些员工对 Meta 特别警惕。而这种警惕,有时也扩展到了 Meta 以外的其他硅谷大厂文化影响。


2024 年,一位曾在 Meta 任职的高管 Kevin Weil(当时担任产品负责人)加入 OpenAI 后,内部流传的一份长篇备忘录引起骚动。在文件中,Weil 提出要将 ChatGPT 的每周活跃用户数推至十亿,并让它通过 “牙刷测试(toothbrush test)”,即成为用户每天都想用的产品。


而据一名前 OpenAI 员工称,当时担任 CTO 的 Mira Murati 在内的一些高管对此表示不满,他们觉得只强调“增长用户数”而非“打造优质产品以吸引用户”的策略,是错误的。


对于 OpenAI 最近推出的应用 Sora,有员工质疑这是否是 OpenAI 应该走的方向,并且担心公司对社交平台普遍面临的挑战(如评论和消息的内容审核)准备不足。


据报道,OpenAI CEO Sam Altman 在上个月试图缓解这些焦虑:他在 Slack 中提到,Sora 不必然推动 OpenAI 的“超级智能”目标。但即便未来有了超级智能,人们仍然会想要“有趣、轻松”的内容。


这种说辞与 Meta 当年招募 AI 研究员时的说法非常相似。近几个月来,Meta 在对外招募时也提出类似论点:即便未来超级智能替代大部分工作,人们仍需打发闲暇时间,而 Meta 可以提供娱乐服务。就在 Sora 上线前几天,Meta 也在自家 AI 聊天机器人里加入了名为 Vibes 的短视频推荐流,风格与 Sora 类似。


OpenAI 内部也有员工担心,公司对广告的态度正在软化。


直到去年五月,Altman 还把广告称为“万不得已的选择”,并直言广告“让人不安”。但他近来的表态似乎放松了许多。“我觉得广告有点让人反感,但并非完全不可接受。”他在本月的一次播客中说,“有些广告我还挺喜欢的。我要给 Meta 点赞,他们的 Instagram 广告对我来说是净增值,有时候你不知道自己需要什么,但广告会给你推好东西。”


据两位在职员工透露,Simo 在公司内部会议上也表示,OpenAI 正在研究广告以及广告如何为用户带来价值。OpenAI 发现,有些用户已经默认 ChatGPT 的回答中存在“赞助排序”,甚至认为 OpenAI 已经在卖广告。有些员工正以此为据,支持把广告引入产品。


负责广告方向团队之一的战略规划部(Strategic Initiatives)由曾在 Meta 负责 AI 伦理工作的 Irina Kofman 领导,该团队中也有不少人来自 Meta。这个团队当前的研究方向之一就是评估是否能基于 ChatGPT 的“记忆”来展示广告。


OpenAI 战略与运营团队的负责人 Becky Waite,此前也在 Meta 的危机管理团队工作。她在 OpenAI 负责选举相关的准备工作,同时也处理诸如社会动荡、在线安全监管等重大议题。据悉,她的团队还参与了 OpenAI 与微软就合作协议进行的谈判。


不过,随着公司规模在两年内从约 800 人扩张到现在的规模,且上半年营收达到 43 亿美元,这种商业化的方向改变也有支持者。


这些变化都发生在 ChatGPT 持续高速增长的背景下。过去一年中,Altman 在全员大会上多次强调,要让 ChatGPT 的使用频率更高,比如把月活用户变成周活甚至日活——这与 Meta 以及其他社交公司的增长策略如出一辙。产品团队也据此推出了一些功能。


在这样的背景下,OpenAI 虽然试图保护其研究团队的独立性——OpenAI 研究团队仍由首席研究官 Mark Chen 领导并直接向 Altman 汇报,研究团队还单独迁入了旧金山的新办公室,但这种趋势仍然对团队的研究方向产生了影响。


参考链接:

https://x.com/testingcatalog/status/1982165811729973726?s=46

https://www.theinformation.com/articles/openai-readies-facebook-era

https://www.reddit.com/r/GithubCopilot/comments/1mtqbzo/gpt5_mini_is_not_just_bad_its_a_disaster/


文章来自于“AI前线”,作者“褚杏娟”。

关键词: AI新闻 , GPT-5.1 , OpenAI , GPT-5.1 mini
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT