AI大模型价格战开打，一年决胜负？

10403点击 2024-05-26 14:20

AI大模型价格战开打，一年决胜负？

你或许在影视剧中常见到这样的场景：几派势力在争夺地盘时枪支举起，彼此对峙，人人都不敢扣下扳机，人人又都想扣下扳机，一场火拼，一触即发。

这叫做“墨西哥僵局”，指对峙的多方因互相牵制而形成的微妙平衡。

如今这种僵局，在AI领域被打破了。扣动扳机的人，是OpenAI。

5月14日，OpenAI发布GPT-4的升级版——GPT-4o，并宣布向所有人免费开放。

一天后，大洋彼岸的枪声终于传来，火花划过此处沃土。

5月15日，字节跳动宣布旗下豆包主力模型，输入价格为0.0008元/千Tokens（Token是大模型使用的输入数据的最小单元，比如单词或字符等）。

AI大模型价格战开打，一年决胜负？

子弹开始呼啸而过。

6天后，也就是5月21日，阿里巴巴宣布通义千问主力模型大幅降价，主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%，立即生效。

四小时后，百度跳过降价，直接宣布，旗下大模型文心一言的两款入门级产品ERNIE Speed和ERNIE Lite免费。

一天后，后知后觉的科大讯飞与腾讯，也纷纷宣布：讯飞星火API能力免费开放，讯飞星火Lite API永久免费开放，讯飞星火pro/Max API价格降至0.21/万Tokens；

腾讯的混元大模型全面降价，其主力模型之一的混元-lite模型价格从0.008元/千tokens调整为全面免费。

……

枪响，人灭，在这种场景下似乎并没有发生。但没有人会怀疑，在接下来的时间里，这种事情不会发生。

毕竟当一个行业的竞争，以价格战的形式出现在大多人眼前时，往往意味着行业内的企业，已经到了势同水火的地步。

不过企业们对价格战也有自己的解读，例如火山引擎总裁谭待说：“亏损换收入不可持续，我们不会这么做。”

又例如阿里云智能集团副总裁刘伟光说：“AI推理成本只有每年有十倍甚至百倍的降低，才能真正推动行业各行各业的AI应用的爆发。”

若要再往前追溯，私募基金幻方量化大模型DeepSeek与智谱AI的入门级大模型降价得更早：

5月7日DeepSeek宣布将旗下大模型DeepSeek-V2的价格降到了每百万token输入1元、输出2元（32K上下文）；

5月11日智谱AI调将旗下入门级大模型GLM-3-Turbo（上下文长度128k）的价格，从0.005元/千tokens降低到0.001元/千tokens，而GLM-3 Turbo Batch批处理API便宜50%，达到1元200万tokens。

不过，这是否意味着，普通人更有机会低成本乃至零成本的使用大模型了呢？

答案恐怕是否定的。

如今大模型主要存在两种商业收费模式：

第一种是让C端用户付费，即ChatGPT Plus 20美元/月这种会员订阅模式。

第二种是让B端用户付费，即开发者API调用服务，让开发者接上大模型的“水龙头”，用上里面的“水”。

这次降价的正是第二种。

相较而言，B端市场比C端规模小得多，因此看起来声势浩大的价格战，于企业方而言，成本压力不算太大。

于普通人而言，人人都能低成本用AI的好时候，也尚未来临。

与此同时，进一步的争议也随之而来：当国外公司却想办法努力奔跑保持技术领先，来奔向星辰大海时，国内公司却都在商业化、卷市场份额？

比如黄仁勋说，我们公司从不谈论市场份额，这意味着大家在做同样的事；马斯克说，我不关注技术壁垒，我只关注创新的速度；奥特曼说，AI发展就像龙卷风，OpenAI要突破极限。

以上的话越看越鼓舞人心，但放到现实的环境中，当行业的领导者居于技术领先的位置，只能不停地保持领先，才能持续获得行业最多的资源。

这时的跟随者本就有多种方式追赶，充分的商业化可以为持续的跟随，提供资金耐力。

马拉松跑到终点前，追随者超越领跑者的案例并不少见。

当然这当中还有种种问题，我们也请到了专业的大头来解答。

AI大模型价格战开打，一年决胜负？

这几天，大模型降价的降价，免费的免费。照这个样子发展下去，过两天会不会有倒贴的呢，到时候你会怎么选。

我的选择是，谁家送鸡蛋，我就选谁家。在发展到还没送鸡蛋之前，我从理性逻辑出发，讲三个观点：

◎ 首先，价格战带来了AI的全民普及。有人说，AI就像空气，未来我们无法离开它。而大模型价格战，恰如其分地扮演了“空气净化器”的角色。

百度、阿里等巨头纷纷降价，甚至免费，让普通人也能轻松接触到更好的新鲜空气、更好的AI工具。

其实降价的根本原因在于大模型推理的成本也在逐步降低，OpenAI在过去一年多的时间里降价幅度达到了惊人的90%。

只不过，OpenAI是一年时间内降了这么多，我们是一夜之间降了这么多，所以感觉冲击波更大。

国产大模型的内心OS：技术上我暂时还超不过你，降价速度我还超不过你了？

AI大模型价格战开打，一年决胜负？

其次，价格战也带来了行业内耗与同质化隐忧。

大厂们打得火热，小厂们则可能面临“灭顶之灾”。

想象一下，小型AI公司在价格战中的境遇，就像是一只在大象脚下跳踢踏舞的老鼠，既要保持优雅，又要避免被踩城“鼠泥”。

价格战还可能会导致市场的资源错配和浪费，过度的价格竞争，会迫使厂商削减成本，从而在研发和创新方面投入不足。

这不仅不利于整个行业的长期发展，还可能导致市场集中度过高，形成寡头垄断，进一步抑制市场的活力和创新动力。

◎ 最后，要打赢价格战，就必须坚持创新、提供差异化的服务。

价格战只是百模大战的第一回合，真正的“终极对决”，在于技术和服务的创新。

就像美食界的竞争一样，打折的面条，可能暂时俘获消费者的胃，但真正让人念念不忘的，还是那碗独具风味的"秘制牛肉面“。

在大模型领域也是如此，价格战之后，谁能做出那碗”秘制牛肉面“，谁就能在未来的竞争中脱颖而出。

AI大模型价格战开打，一年决胜负？

大模型的价格战，并不可怕。价格战的出现，有两大原因。

第一个原因就是科技大厂的算力都有富余。

中美摩擦升级的时候，中国科技大厂都怕断供，就疯狂地囤积英伟达的芯片，把算力资源迅速堆了上去。

后来华为的昇腾系列芯片做起来了，大厂们又进行了大量的采购。从百度和阿里的财报可以看出，这方面的开支非常庞大，高达几十亿元。

不过，AI应用的推广速度并没有他们想象的那么快，导致算力处于空转状态，前期砸的资源被浪费。

现在大厂都在想办法摊薄成本，让算力滚起来。

值得注意的是，二手市场的英伟达芯片，现在不好卖了。

想卖给政府，政府不会要，他们只会用国产芯片。想卖给云平台，可云平台算力富余，没必要再买新芯片。

我接到好几拨美国来的电话，说能不能帮忙联系一下，他们手里边有英伟达的A100或者H100。

第二个原因是技术和服务进步。

实际上，ChatGPT跟阿里云、百度云完全不是一个概念。

ChatGPT做的不是公有云，没有考虑公有云的动态分布，也没有考虑企业应用场景，而是疯狂在大模型上堆加资源。

AI大模型价格战开打，一年决胜负？

反观中国的云服务商，就要为企业用户考虑，让他们在自家平台上把人工智能和大模型用起来，所以中国大厂的服务会更好。

不论是阿里云，还是百度云，已经可以对原本的算力资源进行更大价值和更有效率的动态分配。

打个比方，原来100块卡可以服务150个用户，现在经过技术升级，100块卡能服务250—300个用户，无形之中就提升了算卡的利用效率。

算力资源的富余，应用技术的提升，两者叠加就有了打价格战的基础。

纵观历史，现在的大模型之战，跟互联网时代的千团大战、打车APP大战一样，都给补贴，都给低价，杀到最后，只剩两三家巨头。

预计明年上半年国产大模型就会决出胜负，公有云市场也会发生变化。

谁在这上面占优势，谁就可能把公有云业务也拿下来。这也是阿里云率先降价的重要原因，它想守住优势地位。

AI大模型价格战开打，一年决胜负？

国产大模型突然发起价格战，主要有三个原因。

一是国内厂商之间以价格战来圈用户；

二是国外实力更强的中低阶竞品已经免费，国内厂商以前的资费标准就作废了；

三是长文本应用和多模态需要更多Token，如果资费还维持不变，用户的使用成本就会高得离谱，厂商就会成为平台孤岛。

价格战肯定不是好事，尽管价格往下走是必然。免费不是重点，模型的原理迭代、水准提升、多模态进化才是关键。

免费积累起来的海量用户，有可能因为模型智能水准被甩在身后而一夜流失。

现在，价格战成了国内厂商的传播亮点。这是不对的，大家应该关心的是，在模型原理迭代、水准提升和多模态等方面的创新突破。

不同体量的公司，突破方向不一样。资金浅的创业公司应该聚焦应用，模型的微调或RAG或场景化专业模型。

但是有实力的厂商一定要敢于做底层突破。不好好做作业，将来想抄作业都抄不明白，抄错更是大概率。

照抄作业不行，照搬经验也不行。想把互联网思维带到超级智能这一波，恐怕是对AI的价值源泉和发展范式有误解，结果无异于自嗨。

中国互联网没能及时走向下一个时代，背后就是这种应用、流量、快钱思维在起作用。

人工智能时代，科技成为价值原力，面向AGI、EI、II的竞赛，流量只是依附于科技之上。

网红意义上的流量，不会给AI产品带来用户忠诚度，尤其是通用生成式大模型，水准略差用户就会瞬间流失。

没有底层技术驱动的核心能力的持续进化，以应用场景去打造所谓强智能无异于空中楼阁。

最后我想说，AI必须普惠每个人，AI必须以人为本。

科技要有价值观，科技越来越强大的今天和未来，科技及其业者应该始终想着帮助人、服务人，造福人类，而不是支配人，更不是控制人、驱逐人、挤压人。

AI大模型价格战开打，一年决胜负？

随着国外大模型降价和开源数量越来越多，中国大模型厂商宣布降价或免费，其原因主要是想要扩大用户量。

大模型付费用户规模有限，难以训练出有用的AI，降价可以吸引更多用户参与，提高数据规模，促进模型完善，同时也有助于扩大市场份额。

价格战可以看作是市场竞争的一种策略。

一方面，它有助于消费者获得更低成本的产品或服务，推动技术普及和创新。

但另一方面，过度的价格战可能会导致利润压缩，影响行业的健康发展，甚至可能引发恶性竞争。

大模型的付费用户本来就不多，降价也不会给自己带来不利影响。

面对大厂的价格战，创业公司也要做好烧钱的准备，尽快形成自己的竞争优势。

创业公司要专注细分市场、提供差异化服务、加强技术创新或提高运营效率，还可以寻求合作伙伴或投资者的支持，以增强自身的竞争力。

除了免费策略之外，提升技术水平是最核心的策略。

此外，还可以采取以下措施来扩大用户基础：提供高质量的客户服务和技术支持；与行业领导者合作，开发行业解决方案；通过教育和培训提高公众对AI技术的接受度。

“让更多人用上AI”是一个应用层面的单向度的愿景目标。从理论上说，AI技术的普及将带来巨大的社会和经济效益。

但实际上，大模型的投入产出比，并不符合这种预期。我们适合从底层研发角度，提倡打败大模型的远景目标。

文章来源于“吴晓波频道”，作者“梅浩宇、饶祖分”

AI大模型价格战开打，一年决胜负？

关键词: 大模型 , AI大模型 , 国产大模型 , GPT-4o

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner