GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?
7971点击    2026-05-28 20:59

前沿大模型的涨价游戏,还能玩多久?


今年1月至今,GPU租赁价格上涨超过两倍。 


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


根据Counterpoint 2月发布的《内存价格追踪报告》,2026年第一季度至今,内存价格环比上涨80%-90%,创下前所未有的大幅飙升。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


这种价格上涨,自然传递到了下游。


Epoch AI刚刚发布的《梯度更新》报告,做了一件简单粗暴的事:把全球所有Blackwell芯片能处理的Token数量算出来,再和实际需求一比。


结论只有一个字——不够


Token洪流吞没一切


先看供给侧。


Epoch AI的模型以Kimi K2.6为基准——万亿参数、320亿活跃参数的MoE架构。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


在8000:1000的输入输出比下,全球Blackwell集群的理论极限是每秒约200亿输出Token


听起来很多?换算一下:够地球上每个人每月用700万Token。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


但这是理想情况。一旦上下文窗口拉长到128k,吞吐量直接暴跌50倍,降到每秒约5亿Token。


再看需求侧。


Google刚刚披露,自家每秒处理约12亿Token(输入+输出)。


按8k:1k请求比例换算,每秒输出Token约1.3亿。Exponential View估算,Google大约占全球Token需求的25%。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


这意味着当前全球Token需求,用Blackwell全产能、全给昂贵的万亿参数模型去跑,勉强能撑住。


但需求在以什么速度增长?


每年10倍。


自2024年以来,Google处理的Token量年增10倍,其他供应商的增速也差不多。


而供给侧呢?全球AI算力年增3.4倍,芯片内存带宽年增4.1倍。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


供给3.4倍 vs 需求10倍。差距每年都在撕裂。


Meta员工一天烧100万Token


算力紧缺不是抽象数字。


看看企业内部在发生什么。


The Information报道,Meta的8.5万名员工每月消耗60万亿Token


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


换算下来,每位员工每天烧掉约100万输出Token。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


Apple更猛。


部分工程团队被允许每天在Token上花费300美元——按Kimi K2.6的价格算,够一个人一天生成2500万输出Token。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


这还只是两家公司。


全球约有1400万软件工程师每天在用AI。


如果他们的使用强度达到Meta或Apple员工的水平,全球Token吞吐需求将飙升至每秒2亿到40亿Token


40亿。


而Blackwell长上下文的极限是5亿。差了整整一个数量级。


Claude Code让开发者慢了19%


更尴尬的事情也在发生。


METR的最新研究显示,Claude Code在实测中让资深开发者的完成速度慢了19%


VS Code相关插件的安装增速自年初以来明显趋平。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


编码工具的增长放缓,背后可能是两个原因叠加:一是算力资源本身在吃紧,二是很多企业已经烧完了全年的AI预算。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


与此形成鲜明对比的是,前沿模型还在涨价。


ChatGPT Pro订阅价格上调,Claude的API价格水涨船高,Gemini的涨幅最凶——部分场景下价格暴涨3倍。GPT-5.5的定价更是直接翻倍。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


用得更多,花得更贵,效果却未必更好。


企业的算盘很快就打清楚了。


逃向DeepSeek


一条逃跑路线已经成型。


DeepSeek V3的训练成本仅为前沿模型的1/10到1/20,API价格低至同类的1/16。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


性能呢?直逼GPT-5。


Hacker News上一个帖子火了:一套11个月ROI模型,手把手教企业算清楚——从GPT-5.5切到DeepSeek,每年能省多少钱。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


评论区的共识很简单:前沿模型的定价权正在崩塌。


当一个开源模型能用1/16的价格跑出90%的效果,涨价就不再是信心的体现,而是客户流失的加速器。


Tokenmaxxing——企业疯狂堆Token用量来榨取AI价值——本来是前沿模型的增长叙事。


但现在,The Information的报道显示,这种策略正在反噬AI公司自身的利润边际。


用户越多,亏得越多。涨价止血,用户就跑。


经典的死亡螺旋。


GPT-5.5翻倍,Gemini涨3倍:这波涨价游戏还能玩多久?


算力悬崖前的决赛格局


把视角拉远一点。


前沿实验室——OpenAI、Anthropic、Google DeepMind——仅占全球AI算力的20%-30%。


剩下的70%-80%在企业自用、云服务商、推理服务商手里。


这意味着,即便是最顶尖的实验室,也无法靠自建算力解决供需缺口。它们和所有人一样,在抢同一批芯片。


算力每年增3.4倍,需求每年增10倍。这个剪刀差不会自动消失。


更小的模型确实在替代部分需求——蒸馏层的崛起证明了这一点。但能力提升又在不断制造新需求。


AI行业正站在一个悬崖边上。


不是技术的悬崖,模型还在变强。是经济的悬崖,算不过来账了。


当GPU租金翻倍、API价格暴涨、开源替代品性能逼近、编码工具的ROI被质疑,一个核心问题浮出水面:


前沿模型的护城河,到底是智能,还是算力?


如果答案是算力,那么谁控制芯片,谁就控制AI的未来。如果答案是智能,那么DeepSeek用1/16的价格逼近同等效果,已经在动摇这个答案。


参考资料:


https://epoch.ai/gradient-updates/is-a-compute-crunch-coming


https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025


https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610



文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站