关于大模型开源还是闭源的争论,看起来还要持续很久。继今年4月举行的Create 2024百度AI开发者大会上,百度创始人李彦宏宣称,“开源模型会越来越落后”。
紧接着互联网圈大佬中另一个经常谈论AI的周鸿祎则表示,“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。”
就在不久前举行在2024世界人工智能大会(WAIC 2024)上,李彦宏又向开源大模型“开炮”,并直言开源模型就是智商税,“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”
但这一次与李彦宏打擂台的不再是自称开源信徒的周鸿祎、而是阿里云CTO周靖人,后者在同一场活动中表达了对开源大模型的支持。周靖人认为,国产大模型的主动开源,可以极大地缩短了开源与闭源模型之间的差距,使普通开发者也能使用顶尖的AI模型,将显著加速大模型的应用落地进程。
大模型究竟应该开源或者闭源,在国内既是技术之争、其实也是路线之争。
先来看看技术层面,目前业界对于开源大模型的质疑主要是安全性存疑和缺乏推理(reasoning)能力上。对于开源模型安全性的质疑其实有一定道理,因为开源软件的运行规则就是一旦将代码开源后,产品的命运就不完全掌握在作者手中,变为了属于所有开源参与者或社区的。
只要遵循相应的开源协议,其他开发者拿着开源软件干什么都行,例如在大名鼎鼎的AOSP的基础上,就诞生出了MIUI等等一大批第三方的Android ROM。可是AI大模型与传统的开源软件不同,因为大模型的“主观能动性”太强,它可能存在的破坏性是史无前例的,因此也就有了AI对齐概念的问世,要求大模型的价值观需要与人类对齐。
问题是AI对齐已经被证明会降低大模型的性能,因此业界担心会有“疯狂科学家”不使其模型与人类的整体利益对齐,开源模型会成为后者的帮凶。此外长期以来,开源模型不仅在基准测试中表现比闭源模型较差,而且缺乏涌现功能。如果忽略文心一言,被李彦宏挂在嘴边的ChatGPT、GPT-4、Claude-3,确实就证明了闭源模型的强大。
在这里李彦宏其实也用了话术,GPT-4不是因为闭源而强大,而是因为强大选择了闭源。就如同OpenAI的闭源逻辑是因为产品的竞争力足够强,但其GPT-2在2019年发布时则是开源的,到了ChatGPT(GPT-3.5)、GPT-4o的时候就转为了闭源。彼时OpenAI发现自家大模型处于“一览众山小”的状态,闭源显然是利益最大化的手段,要不然ChatGPT Plus可不会卖爆。同样,Anthropic的Claude-3也一样,正是因为产品力强到具有了不可替代性。
至于说开源大模型的推理成本更高,其实也不太站得住脚,因为决定大模型推理成本的关键因素不是大模型本身,而是云服务提供商。在此前国产大模型的价格战背后,其实是腾讯、阿里、京东、华为等云服务厂商新一轮价格战的表象。更何况在Martian的Provider Leaderboard(推理成本排行榜)中,开源模型和闭源模型的表现是伯仲之间,并没能在统计学层面拉开差距。
此外,闭源模型和开源模型的路线之争还表现在对开发者的争夺上。国产大模型“不服跑个分”的时代已经过去,现在是追求AI应用场景的阶段,这时候就需要第三方开发者群策群力了,正一如当年Android和iOS的故事。彼时苹果iOS率先起步、谷歌的Android作为追赶者,如今国内的百度以及海外的OpenAI也都是AI领域的先行者,并都选择了闭源,而拥抱开源的阿里、Meta则在后面奋起直追。
众所周知,iOS和Android在移动操作系统市场的市占率是2:8,但苹果App Store每年贡献的收入却比谷歌的Google Play更高。所以有了苹果的珠玉在前,只要这一轮AIGC能复刻移动互联网的成功,坚持闭源路线的厂商就有资格复刻苹果的成功。同理,选择开源路线的厂商则在效仿Android。
最后放一个小彩蛋,对于开源模型是不是智商税这个问题,我们咨询了文心一言的意见。它的说法是,“它(智商税)过于简化了开源模型和闭源模型之间的复杂关系。”
本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌