否认放弃大模型，百度目前并不打算因小失大

5935点击 2024-09-28 11:14

早早打出“All in AI”的百度，一直都是国内AI赛道的领跑者。

最近，网络上突然传出百度要放弃通用大模型研发的消息。要知道就在去年举行的中关村论坛上，百度创始人李彦宏还曾表示，“AI大模型将改变世界，百度要做第一个把全部产品重做一遍的公司”。毫无疑问，All in AI是过去一年百度的基调，但这个传言直指他们突然要不做大模型了。

如此强烈的反差，自然也引得各路吃瓜群众下场。眼见这个消息越传越广，百度文心一言的市场部负责人张全文在朋友圈辟谣，“所谓‘放弃通用大模型研发’纯属谣言！文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。”

事实上，从百度近期的一系列动作来看，怎么看也不像要放弃大模型的样子。就在不久前，百度方面宣布文心一言App升级为文小言，定位百度旗下的“新搜索”智能助手，并带来富媒体搜索、多模态输入、文本与图片创作、高拟真数字人。而在两个月前，他们才刚刚发布了文心大模型4.0 Turbo。

否认放弃大模型，百度目前并不打算因小失大

那么问题就来了，近年来一直押注AI，且进入2024年以来也继续在大模型上投入资源的百度，关于他们要退出大模型研发的谣言为什么会有市场呢？

不同于以往的传言，这次谣言的作者用洋洋洒洒数百字给出了一个逻辑自洽的帖子。给出的理由，是下一代大模型的研发成本高昂，且当下大模型缺乏可行的变现渠道，唯独拥有现金奶牛的厂商才烧得起钱。

大模型的研发成本越来越高这件事，确实是事实。按照Anthropic首席执行官Dario Amodei此前在播客节目中的说法，该公司目前正在开发的AI模型训练成本高达10亿美元，并且他还预测，训练大模型的成本将在短短三年内就上升至100亿美元的水平。

否认放弃大模型，百度目前并不打算因小失大

同时更让AI厂商烦恼的，是直到今天，不光大模型本身不挣钱，使用大模型作为基座的各类AI应用也赚不钱，使得他们都押注下一代大模型的智能化水平会再一次出现跃迁，让AI Agent得以落地。从某种程度上来说，现在的大模型研发已然变成了一场“胆小鬼游戏”，而在一众大厂里百度确实是最“胆小”的。

根据百度方面此前发布的2024年第二季度财报显示，其最大的收入来源线上广告业务该季度收入为192亿元、同比下滑2%。造成这一结果的原因，是AI在搜索结果内的渗透率达18%，但由于并未商业化，进而拖累了广告收入的增长。而在B端的百度云业务中，9%的收入来自外部客户使用大模型及生成式AI相关服务，这个数字显然还不足以证明AI重塑了百度云业务。

否认放弃大模型，百度目前并不打算因小失大

最致命的风险是Scaling Law没有失效，以至于通用大模型的开发看起来就变成了无底洞。而Scaling Law是指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关，换而言之，只要继续堆参数、堆算力，大模型的性能就会进步。例如OpenAI刚刚发布的“草莓”大模型（OpenAI o1），就继续验证了Scaling Law的有效性。

Scaling Law对于绝大多数体量有限的大模型开发商显然不是一个好消息，因为这意味只要肯花钱，大模型就一定会进步。简而言之，现在的大模型开发已经变成了一个纯粹的氪金游戏，购买英伟达H100等算力卡、雇佣专业的AI科学家、清洗出更高质量的语料，乃至向外界宣传大模型，样样都离不开钱。

否认放弃大模型，百度目前并不打算因小失大

可问题在于，市值300亿美元、现金储备550亿人民币的百度在一众大厂中并不出挑，而且现在百度的AI战略是大模型和AI应用全都要。一边是“橙篇”、“文小言”，以及智能体联盟解决方案，另一边是要在2025年亮相的文心大模型5.0。相比于搞得风风火火的文小言和智能体，文心大模型在今年确实显得缺乏亮点。

月之暗面的Kimi开启了大模型内卷长文本的先河，幻方的SeepSeek消除推理时间键值缓存的瓶颈，未来极有可能会成为所有模型共同采用的优化方式。可反观百度的文心大模型，目前最强的ERNIE-4.0-Turbo-8K旗舰级模型在跑分上也已经成为了追赶者。

否认放弃大模型，百度目前并不打算因小失大

因此这样看来，放弃大模型是一个在商业层面说得过去的决策。只不过如果百度真的选择放弃大模型的研发，就意味着它要从牌桌上下来，这对于百度的品牌价值而言就会是一个巨大的打击。要知道早早打出“All in AI”的百度，一直都是国内AI赛道的领跑者，放弃大模型就等于放弃了通往未来的船票。

当年百度已经为错失移动互联网时代付出了巨大的代价，如果现在真的要继续放弃AI时代的入场券，恐怕接下来“BAT”的含义就要变了。

文章来自于微信公众号“三易生活”，作者“三易菌”

否认放弃大模型，百度目前并不打算因小失大

关键词: 百度 , AI , 文心一言 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目，该项目可以帮你实现“线上线下的数字人销售员”，
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址：https://github.com/xszyou/Fay

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales