618 的风,还是吹到了大模型这里。。。
最近这段时间,大模型厂商们是分不刷了,参数不比了,甚至连长文本也懒得卷了。一个个的都掉转车头,打起了价格战。
什么 “ 连降 99% ” , “ 注册就送 ” , “ 限时免费 ” 等等。。。各种 618 专属名词,都挂在了各个大模型厂商的主页。
在这里,先跟不太懂的差友科普下,不少大模型厂商们,都会把 API 接口开放出来,赚个其他企业或者开发者们调用的钱,其中,它们卖的,就是token 数,像咱跟模型对话的时候,消耗的就是 token 。
最先打响token 价格战的,其实是个大模型创业公司——幻方,它率先把每百万 token的价格达到了一两块钱的级别。
打个比方,把 token 换算成汉字,原来一块钱咱只能买得起两万来字的短篇,现在同样的价格,能把整套《 三体 》打包下来,还绰绰有余。
很快,智谱 AI 也拿起了刀,对着自家大模型 GLM-3 Turbo 唰唰来了好几下。
原来 5 块钱 100 万个 token ,直接打两折,只要 1 块。本来新用户注册送的 500 万个 token 数,也连着翻了五个跟头,提升到了 2500 万。
有趣的是,智谱还直接贴着阿里和百度两个大厂的脸开大,做了个价格对比图。。。
这还没完,紧接着,上周字节在火山引擎原力大会上,把价格战又推进了一步。
它给出的折扣比幻方和智谱还要大,他们家的豆包大模型, 8 毛钱就能买到 100 万个 token 。
而且同样拉来了阿里和百度来做对比,就差指着它们的鼻子说 “ 轮到你们了 ” 。
到这时,大厂之间的大模型价格战,算是正式拉开了序幕。。。
被拉着鞭尸了好几次的阿里和百度,终于也坐不住了,就在昨天,前后脚官宣了 “ 大降价 ” 的消息。
世超瞅了眼阿里的降价名单,一出手就是连降九个模型,从开源的到商业化的大模型,通通都打骨折。
同样级别的模型,同样的 token 数,比上面提到的那些都还要便宜。像是 GPT-4 级别的 Qwen-Long ,五毛钱就能买下 100 万个 token 。
百度这边呢,虽然没啥降价的模型,但也先直接宣布了有两个基础的模型能免费调用。
而就在世超写稿子的时候,腾讯也甩出了自家的大模型 618 降价方案,打折力度五折起。
估计照这架势,各位企业和开发者们离 token 自由都不远了。。。
当然,咱也别担心大模型厂商是不是赔钱,或者倒贴钱搞价格战。火山引擎总裁谭待在降价的时候,就直接亮明了底牌,说是不亏钱。
而能打得起这场价格战,在世超看来,很大一部分原因是,大模型厂商们有这个本钱和实力。
这次宣布降价的,基本上都是手里实打实握着算力资源的企业,不是云厂商,就是手里有大把大把的显卡。
字节有火山引擎云服务平台,阿里有阿里云,就连初创企业幻方 DeepSeek ,他们也有自己的 AI 智能超算集群,里面有1 万来张英伟达的 A100。
另外这几年,大模型厂商们也都攒下来了一波技术红利,训练和推理的成本也都降下去不少。像是 GPT-4o 都已经慢慢开始向咱白嫖用户开放, API 的价格对比 GPT-4 Turbo 也是几乎腰斩。
零一万物的李开复也预测过,未来大模型的推理算力,每年降个十倍是没啥问题的。
还有,在最最底层的算力调度上,各个云厂商们这两年的长进也不小。
还拿阿里云来说,它搭了个非常强大的AI 算力调度系统,在训练的时候,系统知道怎么调度算力才最有效率,和之前相比,能节省一半的算力资源。
今年年初,大伙应该就已经感受过一次它的冲击,当时阿里云带头挑起了云服务价格战,全线产品直降 20% ,有的直接降价一半,惹得腾讯云、京东云等等都出来卷价格了。
甚至阿里云和腾讯云还跑去直播间带货,去卖云服务器和云存储产品。
除了技术成本确实降下来之外,世超还觉得,大模型厂商们搞出这个价格战,可能恰恰是为了赚更多的钱、抢占更多的市场。
也就是说,大模型降价可能就是叠醋,得花大价钱的饺子还在后头。
这么说吧,虽然大家嘴里吆喝的,都是大模型降价、 token 降价,但实际打骨折价的,就只有模型推理用的 token 。
就拿差评编辑部来说,要想用大模型炼个专属自己的写稿 AI ,肯定不能只买推理的 token ,还得用咱们的文章数据把模型再炼一炼,等训练好之后还得再把新 AI 部署到生产环境中。
后面的这两道程序,要花的钱和推理就不在一个量级。。。就拿阿里的 qwen-turbo 模型来说,百万个 token 用来推理,只要 2 块钱,而要是训练,就得 30 块,部署的话,还得分包月和小时费。
而且,这次大模型价格战打得最狠的,都是阿里云、百度云、腾讯云等等各种带 “云” 的厂商。
世超有理由怀疑,这次大模型价格战,其实只是云服务价格战的延伸,它们最终的目的,还是想把大伙引到自家的云服务生态上。
总的来看,价格战最终卷到大模型领域,大伙们的看法也都是五花八门的,有人觉得,白菜价的大模型会降低门槛,助力企业们加速创新。
也有不少人觉得,要是控制不好降价的力度,最后也可能一地鸡毛,没赢家。
但无论怎么说,照这价格战的发展态势,似乎就只有大厂们才能玩得起了。
至于最后它们到底会怎么收场,咱只能走着瞧了。。。
阿里云
证券时报网,你降 97% ,我免费!大模型,迅速开打价格战!
新浪科技,李开复谈 AI 大模型 “ 价格战 ” :整个行业每年降低 10 倍推理成本,这是可以期待的
光锥智能,从 “ 天价 ” 到 “ 骨折价 ” ,大模型要变天了
本文来自微信公众号“差评”(ID:chaping321),作者:松鼠
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales