ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
闭源才能赚钱,百度给闭源大模型投了一票
9646点击    2024-04-17 17:22

早前Meta的LLaMA大模型“意外”泄露后,大模型的开源与闭源之争就此提上了日程。大模型到底是开源好、还是闭源好?过去一年整个AI业界可谓是争吵不休。如今,又有一位重量级人士站出来表态了。


就在4月11日,百度创始人李彦宏的内部讲话被传出。据悉他在此次讲话中表示,去年文心一言发布时,百度方面就判断市场上一定会有开源的模型,而且不止一家会开源,在这种情况下多百度一家开源不多、少百度一家开源也不少。并且他认为,大模型开源意义不大,闭源才能走通商业模式。



李彦宏之所以坚定押注闭源,在于他认为开源大模型的运行模式和传统开源软件不同,并不是众人拾柴火焰高。作为从自由软件思潮之中诞生的结晶,开源软件也继承了自由软件所提倡的知识共享理念,同时又允许以专利的形式从知识产品中获得收益。事实上,开源本身并不是一种商业模式,而是一种软件的开发、发布和传播模式。


而开源就使得大规模协作开发成为了可能,从GNU/Linux、Android、Chromium这一系列大名鼎鼎的项目,到XZ Utils这类深耕细分领域的产品,它们的成功都是源自于汇聚了开源社区的力量,大量的开发者都在为这些项目贡献力量。然而开源大模型的运行模式则完全不同,如今无论是来自欧洲的AI独角兽Mistral的Mixtral-8x7B,还是美国科技巨头Meta的Llama-2,它们都鼓励开发者贡献各种各样的数据、代码,但Mixtral-8x7B、Llama-2的主要开发者依旧还是Mistral、Meta。



开源大模型很难从社区获益,归根结底在于社区贡献的价值并不一定是正向的。AI大模型会出现“幻觉”(Hallucination),现在几乎已经是业界的共识,AI科学家也仍未完全解开这个谜题,但数据的质量与大模型幻觉呈现正相关则是肯定的。开源大模型接受垃圾代码、低质数据导致性能下降,这样的事情不是没有发生过。甚至Anthropic的研究人员曾发表论文警告,现阶段的安全训练无法消除插入后门触发机制的恶意行为,进而会导致开源大模型变得不安全。


开源大模型缺乏安全性,这也是OpenAI、Anthropic等闭源阵营旗手攻击开源的重要论点。


除此之外,开源大模型在性能上也还无法媲美闭源大模型。如今无论是哪个机构给出的大模型评测榜单中,OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude,以及国产的文心一言、讯飞星火、KimiChat,对比它们的开源大模型竞争对手都更有优势。所以在同等参数的情况下,闭源大模型的能力更强,李彦宏此言并非无的放矢。



此前福布斯的一篇文章《10 AI Predictions For 2024》就曾给了预测,尽管开源模型在某些领域有优势,但最先进的商业闭源模型可能仍将在性能上保持领先。


大家不妨试想一下,如果GPT-4不能保持性能领先,用户就会转向免费的开源模型。当免费、不受限制的替代品在质量上具有可比性时,用户确实不会为受限制的模型付费。可如今的情况,却是开源大模型的性能还不能挑战闭源大模型。


当然,开源大模型最致命的缺陷其实是在商业层面。Meta的Llama-2开源之后,国内的百模大战立刻拉开了帷幕,市面上很快也多了一大堆套壳模型。从某种意义上来说,大模型的开源其实是给自己平白无故地增加了一大堆竞争对手,而且这一部分竞争者又会分食潜在的企业级用户。



由于开源协议本身并没有限制商业化,因此在许多开源软件中存在着免费社区版和收费企业版共存的模式,也就是所谓的双许可证。其中免费版本负责扩大软件的影响力,再用付费版本获利,这就是开源软件经典的商业模式。比如在2018年被IBM以334亿美元收购的开源软件和技术供应商Red Hat,就是这一模式的典型。


开源大模型没有建立起商业模式,这是当下开源大模型鼓吹者始终无法回避的一个问题。抛开众说纷纭的B端业务,OpenAI的GPT-4、百度的文心一言目前都有付费订阅版本,C端用户的付费是实打实存在的。而家大业大的Meta打定主意要用开源来为自己挽回已经跌入谷底的企业形象,Llama则可以被视为Meta方面精心设计的一个广告。



但其他的开源大模型厂商不能总是只靠融资,事实上,即使是开源大模型的代表Mistral,如今对于开源也没有那么坚定。Mistral创始人Arthur Mensch近期在接受媒体采访时就曾确认,Mistral已经推出了商业模型,并且他还坦言,商业模型可以帮助Mistral创造收入。归根结底,大模型太贵,开发成本比传统的软件要高出了数个量级,因此也更加依赖融资。


当大模型与资本的牵扯如此之深的情况下,可后者显然是要谋求回报的,所以这可能才是李彦宏坚定看好闭源的原因。


本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌