早早打出“All in AI”的百度,一直都是国内AI赛道的领跑者。
最近,网络上突然传出百度要放弃通用大模型研发的消息。要知道就在去年举行的中关村论坛上,百度创始人李彦宏还曾表示,“AI大模型将改变世界,百度要做第一个把全部产品重做一遍的公司”。毫无疑问,All in AI是过去一年百度的基调,但这个传言直指他们突然要不做大模型了。
如此强烈的反差,自然也引得各路吃瓜群众下场。眼见这个消息越传越广,百度文心一言的市场部负责人张全文在朋友圈辟谣,“所谓‘放弃通用大模型研发’纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。”
事实上,从百度近期的一系列动作来看,怎么看也不像要放弃大模型的样子。就在不久前,百度方面宣布文心一言App升级为文小言,定位百度旗下的“新搜索”智能助手,并带来富媒体搜索、多模态输入、文本与图片创作、高拟真数字人。而在两个月前,他们才刚刚发布了文心大模型4.0 Turbo。
那么问题就来了,近年来一直押注AI,且进入2024年以来也继续在大模型上投入资源的百度,关于他们要退出大模型研发的谣言为什么会有市场呢?
不同于以往的传言,这次谣言的作者用洋洋洒洒数百字给出了一个逻辑自洽的帖子。给出的理由,是下一代大模型的研发成本高昂,且当下大模型缺乏可行的变现渠道,唯独拥有现金奶牛的厂商才烧得起钱。
大模型的研发成本越来越高这件事,确实是事实。按照Anthropic首席执行官Dario Amodei此前在播客节目中的说法,该公司目前正在开发的AI模型训练成本高达10亿美元,并且他还预测,训练大模型的成本将在短短三年内就上升至100亿美元的水平。
同时更让AI厂商烦恼的,是直到今天,不光大模型本身不挣钱,使用大模型作为基座的各类AI应用也赚不钱,使得他们都押注下一代大模型的智能化水平会再一次出现跃迁,让AI Agent得以落地。从某种程度上来说,现在的大模型研发已然变成了一场“胆小鬼游戏”,而在一众大厂里百度确实是最“胆小”的。
根据百度方面此前发布的2024年第二季度财报显示,其最大的收入来源线上广告业务该季度收入为192亿元、同比下滑2%。造成这一结果的原因,是AI在搜索结果内的渗透率达18%,但由于并未商业化,进而拖累了广告收入的增长。而在B端的百度云业务中,9%的收入来自外部客户使用大模型及生成式AI相关服务,这个数字显然还不足以证明AI重塑了百度云业务。
最致命的风险是Scaling Law没有失效,以至于通用大模型的开发看起来就变成了无底洞。而Scaling Law是指大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,换而言之,只要继续堆参数、堆算力,大模型的性能就会进步。例如OpenAI刚刚发布的“草莓”大模型(OpenAI o1),就继续验证了Scaling Law的有效性。
Scaling Law对于绝大多数体量有限的大模型开发商显然不是一个好消息,因为这意味只要肯花钱,大模型就一定会进步。简而言之,现在的大模型开发已经变成了一个纯粹的氪金游戏,购买英伟达H100等算力卡、雇佣专业的AI科学家、清洗出更高质量的语料,乃至向外界宣传大模型,样样都离不开钱。
可问题在于,市值300亿美元、现金储备550亿人民币的百度在一众大厂中并不出挑,而且现在百度的AI战略是大模型和AI应用全都要。一边是“橙篇”、“文小言”,以及智能体联盟解决方案,另一边是要在2025年亮相的文心大模型5.0。相比于搞得风风火火的文小言和智能体,文心大模型在今年确实显得缺乏亮点。
月之暗面的Kimi开启了大模型内卷长文本的先河,幻方的SeepSeek消除推理时间键值缓存的瓶颈,未来极有可能会成为所有模型共同采用的优化方式。可反观百度的文心大模型,目前最强的ERNIE-4.0-Turbo-8K旗舰级模型在跑分上也已经成为了追赶者。
因此这样看来,放弃大模型是一个在商业层面说得过去的决策。只不过如果百度真的选择放弃大模型的研发,就意味着它要从牌桌上下来,这对于百度的品牌价值而言就会是一个巨大的打击。要知道早早打出“All in AI”的百度,一直都是国内AI赛道的领跑者,放弃大模型就等于放弃了通往未来的船票。
当年百度已经为错失移动互联网时代付出了巨大的代价,如果现在真的要继续放弃AI时代的入场券,恐怕接下来“BAT”的含义就要变了。
文章来自于微信公众号“三易生活”,作者“三易菌”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales