ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
中国AI今天的问题,是大模型又多又乱
3592点击    2023-11-20 20:08

OpenAI的开发者日活动后,GPTs模式引发了新一轮的AI热潮,开发者调用过分火爆,甚至导致OpenAI服务器一度宕机。随后,花式把玩GPTs的经验,以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论,迎来了一场新的AI狂欢。



但在这种氛围下,却有一种沉默显得像个显眼包。那就是绝大多数大模型公司,似乎都沉默了。为了模仿类GPT的大模型,中国AI圈用了一年时间,雨后春笋般打造了上百个大模型。但其中能够诞生明星应用,能够推动产品创新,甚至能够拥有规模化用户的似乎都寥寥无几。当OpenAI的飞轮效应显现,这些大模型公司就有种越是模仿差距越大的感觉。于是干脆不去追新的热点,埋头把眼前能做的先做完。


记得今年年初的时候,社交网络和媒体都在讨论中国能否有大模型?


当时我们说过,这其实是个伪命题,因为中国早就有大模型。而在ChatGPT爆火之后,中国AI遇到的问题一定不是大模型太少,而是大模型过剩。


今天,这种问题开始浮现了出来。此刻中国AI行业最大的问题,就是大模型太多,而且还挺乱。


摩肩接踵的大模型


中国到底有多少AI大模型?经过一年的井喷式发展,这已经变成了一笔糊涂账。上半年的时候,答案大概是几十个。时间来到11月,有人说是一百多个,有人说是二百多个。总之,中国此刻必然是全世界拥有大模型最多的国家,远远超过美国。


但是,这一百多个大模型有人用过吗?有人对比、评测过吗?恐怕没有。因为除了几个头部大模型形成了用户规模外,其中大部分存在于开源社区,还有一部分只存在通稿里。


这就像什么呢?其实很多人不知道,根据相关数据,中国有2600万足球人口,同样居世界第一。我们无从考证数据从何而来,反正周围踢足球的人看着是不多,而国足的成绩有目共睹。


为什么会出现这么多大模型呢?


首先是今年大模型赛道好,机会难得。虽然科技板块的VC市场非常低迷,但在其他互联网创投项目普遍失效,虚拟货币被严格限制的情况下,AI大模型成为今年近乎唯一的故事。因此即便热钱不多,但还是集中涌向了大模型创业。


其次,与很多人设想的不同,大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才,大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项,在拥有大量开放数据集、免费工具的情况下,仅仅是训练大模型并没有过高的成本门槛,并且所谓大模型项目,往往一个科研团队就可以支撑,不需要像互联网创业公司搭建较为复杂的业务体系。



此外,还有一种“刷业绩”式的大模型,极大程度增加了大模型数量。这种一般是高校、科研机构相关团队,选报大模型方面课题更容易获得立项。其结项结果发布后,大模型数量就又增加了一个。或者是大型企业上级要求做大模型,于是IT部门会根据开源的模型框架搭建一个出来,即使效果不佳,落地困难,也要进行对内对外宣传。


赛道好、成本低、需要完成任务,这几种动力,导致中国大模型越来越多,且产生效率越来越快。


但问题在于,足球人口规模可能确实很重要,但更重要的是有一支能踢进世界杯的球队。


没有希望的窄赛道


那么有人或许要问了。大模型数量说难道不能成为优势吗?我们靠数量出奇迹,说不定数量一多就能选出拔尖的来?


这恐怕并不现实。因为从种种理由来看,今天庞大的大模型规模,都是不可能持续存在。通稿打造类GPT模型而挤入下一个科技时代的美好想法,已经将AI大模型变成了一条没有希望的窄赛道。


我们可以来正视这样几个问题:


1.大模型的数量多,其实和大模型本质背道而驰。


提起大模型,我们会说它的优点是模型的泛化性、高鲁棒性,继而带来了“智能涌现”效果。我们总是惊叹OpenAI的成绩,就是因为GPT系列始终在深度挖掘模型的泛化性。也就是说,大模型的优势就是一个顶一群,用一个模型代替一堆模型,结果反而出现了数量过剩的大模型,这与大模型初衷南辕北辙,并且浪费了海量的社会资源。


2.大模型是底层技术,底层技术的玩家不可能很多。


仅仅以AI开发为例,模型之上还有AI芯片、AI框架。在过去几年,这些领域也有很多厂商布局,但最后大多不了了之。AI芯片无法出货,AI框架无人问津,能够剩下的只有头部一两家而已。大模型也是同样的道理,这是一个注定洗牌到存量很少的赛道。


3. 大模型,距离开发者很远。




绝大多数初创大模型,都会选择开源吸引开发者的模式。但现实情况是,这些模型无论是与国外开源大模型,还是国内头部大模型相比,都没有实际竞争力,无法形成规模化的开发者聚合效应。这些大模型普遍是开源时大力宣传一波吸引关注,但开发者实际体验后马上遇冷。


4.大模型,距离用户很远。


在可见的场景中,绝大多数大模型都缺乏商业化支撑,是这个赛道最大的问题。对应大模型创业型企业来说,一开局就是最艰难的局面。后来广受诟病的机器视觉公司,在开局阶段还有智能安防市场作为支撑。但大模型公司拥有的只是算法,甚至连一条可行的商业化通道都找不到。


这些问题,导致堆积了巨大数量的大模型赛道开始变得并不美好。它今天的情况是,说算法,各个创新;说参数,各个庞大;说调用,根本没人用;说商业,根本没去想。


模型一多,乱象也多


大模型一多,产业赛道开始热络起来,也必不可免出现一些问题。这就是我们说的,大模型不仅有点多,还有点乱。


由于目前阶段,有一股“大模型用不用不重要,先要拥有大模型”的思潮。因此就开始有各种方式降低大模型的开发成本,通过话术夸大价值,甚至硬蹭大模型热度,把不是大模型技术的项目包装成大模型,进而导致大模型圈子里,开始出现良莠不齐、鱼龙混杂的态势,我们可以列举其中的几种:


1.打榜刷分型大模型。由于大模型数量庞大,且实现思路基本一致,这就导致不同公司之间的差异化微乎其微。而为了凸显自己的差异化与领先性,目前通用方式是硬造一个技术术语,然后宣传通过这项技术自身项目刷新了某榜单纪录,在某测试中跑出了多少分。


事实上,大部分榜单都只测试模型的某个维度,可以进行针对性调参。打榜刷分并不难,且有比较大的操作空间。类似的,社区开发者打多少颗星,发了多少篇顶会,也都是惯用的包装方案。


2.结项为主型大模型。有很多用作课题结项,或者企业数字化成果结项的大模型。评审结束,结项成功,开源开放,这三条做到就是它们的生命终点。这类大模型不考虑应用场景与后续更新,有某种朝生夕死的精神特质。


3.动辄开源型大模型。软件开源当然是大势所趋,但随着这几年中国开源事业的兴旺发展,AI模型开源似乎变成了某种“时尚”。加上一些企业更愿意将大模型的开源与免费作为流量聚拢工具。开源,逐渐成为了低质量、低维护大模型的遮羞布。




4.冒名顶替型大模型。大模型火了之后,开始有公司打起了蹭热点的主意。于是,用并非标准预训练大模型技术冒充大模型,甚至干脆把古早的对话机器人、应用软件包装成大模型的案例屡见不鲜。用大模型的瓶子,装其他老酒,也成为了一门生意。


5.套壳变身型大模型。最近,一些创业公司套壳国外开源模型的事件引起争议。其实业界类似手法并不少见,将开源大模型进行改写和包装,摇身一变,成为自研大模型的例子非常多。


这些大模型队伍里的妖魔鬼怪,也纷纷可以通过发明术语、加强定语的方式,来宣传自己的创新能力和差异化。最终导致把真正的技术创新,淹没在了一系列的“伪装创新”当中。


中国AI之春,在去掉90%的大模型之后


如果我们看美国的大模型产业结构,会发现它处在一个每层数量差异不大的金字塔结构里。即OpenAI一家独大,谷歌、微软、Meta、X保持持续竞争力,此外还有20几个较为常用,开发者群落比较活跃的大模型。


当然咱们不是说一定要照搬美国,但从中大概可以看见一个科技大国,在目前情况下大模型产业体量是什么。


中国大模型,已经在短时间内发展出了远远超过本身应有存量的大模型。数量过于庞大的大模型,一方面浪费了极大的研发、算力,以及数据资源;另一方面也蕴藏了一场并不会太久的“危机”。



在资本泡沫相对冷却之后,我们很容易看到这样的情况:忽然之间,众多大模型开始停止更新,紧接着大模型领域的公司大量倒闭。伴随着资本退场,员工待遇下降等问题开始发生,于是媒体开始唱衰大模型寒冬,社交媒体上开始冷嘲热讽AI这门技术。


这种行业猛然转冷,大概率会给真正具有竞争力、创新能力的中国AI企业带来巨大的麻烦。


但是请记住,这并不是AI不行了,而是这些AI公司和大模型项目本来就不行。


这不是AI寒冬,而是中国AI的春天刚刚要真正开始。产业优化重组后的大模型产业形态,才是真正能发挥出中国在应用创新、产品打磨、产业智能化落地等领域的优势。


在中国,相对良性的大模型产业形态,应该是有5家左右可以互相竞争的主流大模型,1到2个能够进行底层技术创新,保持全球竞争力的大模型体系,同时有一系列开源大模型作为补充,以及一些学术领域的大模型作为AI for sience的支撑。此外,还要具备较为完善的大模型配套设施,包括AI芯片、AI计算、深度学习开发框架、AI开发工具,并且这些领域都有较高的自主化程度。换言之,必须要淘汰今天超过90%的大模型。



在这些底层软硬件基础之上,应该有大量创业公司、AI开发者去探索C端和B端的大模型落地。在大模型与行业结合的垂直领域,组成推广和复制行业大模型的产业生态;在主要的C端市场,比如大模型+办公、大模型+娱乐、大模型+信息获取方面,涌入成千上万家公司,形成互联网经济之后的AI经济奇迹。


而从“百模大战”中能够留到那时的只有三种公司:具备核心技术创新的、形成平台型产业链的以及能够快速找到商业出口,形成正向资金循环的。


我们依旧笃信,有一天AI技术上会出现新的抖音、微信、office,甚至更多此前无法想象的东西。


但今天绝大多数的大模型,结局恐怕只能是躺在历史空隙与开源平台上,成为大时代的小脚注。




本文来自微信公众号“脑极体”(ID:unity007),作者:风辞远






关键词: AI模型 , openai