ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
谁才是大模型“四小龙”?
9219点击    2024-07-13 12:09

大模型的船票,哪些公司拿到了?


这两年热闹的大模型创业潮,被业内称为“AI 2.0”。


与之对应的“AI 1.0”,指的是2015年左右开始的那一波AI创业潮,当时诞生了商汤、旷视、云从、依图等明星创业公司,它们以CV技术(计算机视觉)为主导,大量融资,风头无两。这四家公司,是公认的“AI四小龙”。


“AI 2.0”时代,大语言模型成了新的主导技术,业界普遍认为,这一波浪潮会掀起生产力革命。这次同样出现了很多创业公司,它们被投资机构和科技巨头追捧,估值水涨船高。但谁是“大模型四小龙”,目前尚无共识。


有一种说法是,智谱AI、月之暗面、百川智能、面壁智能,这四家公司是新的“四小龙”,在6月中旬举办的2024智源大会上,四位CEO首次同台,“四小龙”的说法就传开了。


还有人说中国有“大模型五虎”:百川智能、智谱AI、月之暗面、MiniMax、云从科技。这里边把面壁智能剔除了。


这些说法没有得到广泛认可。总体上,智谱AI、百川智能、月之暗面可以入围,剩下的这个名额会给谁,还存在不确定性。


我们认为,综合创始人背景、技术实力、融资能力、商业化潜力等因素,智谱AI、百川智能、月之暗面、MiniMax这四家公司,可以称作“大模型四小龙”,它们最有可能拿到“AI 2.0”时代的船票。


1 四小龙,各不同


“大模型四小龙”,各有各的特色,我们分别用四个词来形容:根正苗红(智谱AI)、厚积薄发(百川智能)、高举高打(月之暗面)、隐秘机巧(MiniMax)。


从公司成立时间来看,智谱AI最早——2019年6月,那会儿大模型很小众,科技圈和投资圈没什么人关注。百川智能最晚——2023年4月,当时ChatGPT已经亮相快半年,国内大模型公司正在抢人、抢钱。

智谱AI来头不小,它由清华大学孵化,脱胎于清华大学计算机系知识工程实验室,是根正苗红的清华系。它的核心团队也来自清华,CEO张鹏是清华计算机系博士,总裁王绍兰为清华创新领军博士,首席科学家唐杰是清华计算机系教授。


清华的光环加持,再加上入局早,让智谱AI有一定先发优势。早在2020年,智谱AI就研发并训练了一个百亿参数的模型。OpenAI发布GPT-3模型后,智谱AI加大在预训练大模型上的投入,后来几乎全模型产品线对标OpenAI。


从整体的观感上,智谱AI对外展现的形象很正,讲的故事也很大,包括它背后的投资机构也主要是人民币背景。



最晚入局的百川智能,所有能量来自王小川。


王小川是互联网江湖里的“老人”,早年在搜狐一路做到CTO的位置,后来又在搜狐内部创业,担任搜狗CEO,最后搜狗被卖给了腾讯。王小川的技术实力和创业能力早已被验证,过去这些年他也积累了深厚的人脉,所以当他宣布入局大模型创业时引起了很高关注。


另外,王小川当年带领搜狗搜索跟百度搜索打仗,如今又在大模型赛道和百度狭路相逢,时不时吐槽几句李彦宏,这些素材成为人们茶余饭后的话题,也增加了百川智能的热度。


月之暗面比百川智能早成立一个月,没有显赫的背景,但有一个明星创始人。


杨植麟92年生人,是这几个大模型公司CEO中最年轻的,他毕业于清华大学和卡耐基梅隆大学,学术和工作经历都跟大语言模型相关,之前就在AI学术圈小有名气,算是个小天才式的人物。尤其是他读博士时,跟着苹果AI研究负责人和谷歌首席科学家做研究,发了一些论文,给了他很大加持。


这些标签和光环,被杨植麟充分利用,经过有意识的包装和营销,他树立了清华90后学霸的人设,被打造成新锐大模型创业者的代表。


这家公司的创始人和产品,都比公司有名。今年3月Kimi智能助手爆火出圈之前,很多人根本不知道月之暗面。但杨植麟一路高举高打,硬是靠一个人打满了全场。


MiniMax是这四家公司中最低调的,但实力不容小觑。它早在2021年12月就成立了,比目前市场上活跃的大部分大模型公司都要早,它在2022年推出的AI对话产品Glow,上线四个月就收获了近500万用户,在年轻人中很受欢迎。


当很多大模型公司在拼参数、秀肌肉的时候,MiniMax已经找到了应用场景,并将产品悄悄落地了,还打进了海外市场。


MiniMax的核心班底来自商汤,创始人闫俊杰在商汤从实习生做到副总裁,还曾担任研究院副院长和智慧城市事业群CTO,这项业务曾为商汤贡献了大量收入。在2021年底商汤上市前,闫俊杰离职创办了MiniMax。联合创始人周彧聪也曾在商汤科技研究院主管算法团队。


商汤就是在上一轮AI创业潮中成长起来的,位列“AI四小龙”,如今,闫俊杰创办的MiniMax晋级为“大模型四小龙”,和老东家同台竞技。


总体来看,“大模型四小龙”的四位创始人履历非常光鲜,都是各自领域里的精英,但同时他们又各有特色,导致每家公司的气质和侧重点有所不同,进而导致了竞争策略的差异。


2 融资、估值与站队


四家公司都有融资,估值涨得很快。


目前估值最高的是智谱AI,市场传闻在6月初的一笔融资中,智谱AI估值约30亿美元,中东石油巨头沙特阿美旗下基金投了4亿美元。


月之暗面与智谱AI接近。今年2月由阿里领投的那笔超10亿美元融资中,月之暗面估值已达约25亿美元,这是当时国内AI大模型公司获得的单轮最大金额融资。最新传闻是,腾讯或将入局,将月之暗面的估值推高至30亿美元。


这意味着,智谱AI和月之暗面将率先进入“200亿人民币俱乐部”。


MiniMax和百川智能的估值相对低一些,融资轮次也相对较少。今年3月有消息称阿里领投了MiniMax新一轮大规模融资,估值超过25亿美元。百川智能官宣的融资停留在去年10月,今年4月有传闻称最新估值18亿美元,百川智能否认了。


由于月之暗面和百川智能在2023年上半年才成立,那段时间也是国内大模型投融资最热闹的阶段,所以几笔金额较大的融资,基本都集中在过去一年里。


这四家公司由于被业内认为是头部项目,融资时遭到投资机构拥抢,加剧估值上涨,吸走了行业里的活跃资金。反观那些腰尾部的项目,融资则没那么容易,估值也没这么疯狂。


天眼查数据显示,李开复创办的零一万物,除了公司成立时获得了创新工场的启动资金,对外只获得了阿里云的一笔投资;知乎CTO李大海担任CEO的面壁智能,成立至今获得两笔融资;微软前全球副总裁姜大昕创办的阶跃星辰,没有公开的融资纪录。


跟十年前的那波AI创业潮相比,今天的资金更加理性,或者说是局部疯狂。当年“AI四小龙”融资时,行业里有大量流动的热钱,项目在资本泡沫中长大。



而大模型遭遇了资本寒冬,美元基金退潮,能拿出大钱的大基金不多,头部几个基金抢项目又很强悍,VC对着十来家大模型公司猛投,项目估值一时被拉到很高。


英诺天使基金合伙人王晟对「定焦」说,“百模大战”中很多投资机构陷入迷茫,资金端20多家VC投资很活跃,资产端就几十个项目融了很多钱,两边都没有泛化。实际活跃的投资机构也就20来家,剩下的都是在看热闹,跟着摇旗呐喊。“因为大家第一看不懂,第二不敢投,第三投不到。 一堆创业者各种鼓吹项目多厉害,其实根本没人投。 ”


项目和基金都在扎堆。王晟认为头部几个项目的估值被拉的过高了。


红杉资本投资了“大模型四小龙”中的三家——月之暗面、智谱AI、Minimax,此外还有光年之外和阶跃星辰。今日资本也投资了光年之外,还投了“大模型四小龙”中的两家——月之暗面和智谱AI。


除此之外,“大模型四小龙”从一开始就进入了大厂的射程,主动或被动接受了大厂的投资,提前选边站队。


这与“AI四小龙”时代有很大不同,当年的AI创业浪潮完全由创业公司主导,互联网大厂基本没怎么参与,它们还在忙着抢地盘、大并购,那是消费互联网的黄金时代。今天的大模型创业,OpenAI发布ChatGPT之后,大厂从第一天就下场了,甚至比很多创业者还早,没有给创业公司留出时间差。


大厂基本都是两手准备,一手自研,一手投资。


最典型的是阿里,它除了全力推进自研大模型通义千问,还投资了场上几乎所有的头部项目——“大模型四小龙”+零一万物。腾讯投资了“四小龙”中的三家——Minimax、智谱AI、百川智能,接下来有可能投资月之暗面,另外它此前还投了王慧文的光年之外。美团收购了光年之外,还投资了智谱AI、月之暗面。


从项目的视角来看,智谱AI背后站着阿里、腾讯、美团;百川智能背后有阿里、腾讯、小米;月之暗面是阿里、美团;MiniMax是腾讯。


如果我们相信顶级投资机构和大厂的眼光,以融资情况来看,智谱AI、百川智能、月之暗面、MiniMax这四家公司,毫无疑问是公认的头部,即便它们是被“捧”出来的。


3 如何赚钱?


“AI四小龙”当年也从投资人手中拿了很多钱,但最后从市场上没赚到多少钱。它们的技术很好,商业化很难,客户主要是B端企业和G端政府,通过向它们提供人脸识别等AI解决方案来赚钱。


这不是一个好的商业模式,项目非标准化、落地周期长、成本高,导致后来一提到“AI四小龙”,就跟亏损、烧钱的标签混在一起。


“大模型四小龙”同样要面对来自商业化的拷问。


四家公司中,智谱AI最早进行商业化探索。按照智谱AI自己的说法,公司从成立的第一天起就有收入,在研究技术的同时也在开拓市场。因为智谱AI一开始的研发重点是数据挖掘与科技情报分析,2020年6月OpenAI发布GPT 3后,智谱AI才将重点转向大语言模型。


然而这不能证明智谱AI跑通了大模型的商业模型,反而说明它从一开始就有To B基因,像是上一代视觉AI公司的翻版。


2023年初开始,智谱AI开始组建大模型的商业化团队,人员规模一度发展到上百人,而很多大模型公司所有人加起来都不到一百人。它探索出API、云端私有化、本地私有化等几个主要的变现方式。


智谱AI有意无意进入了巨头的射程范围。今年5月,大模型公司掀起价格战,字节、阿里、百度、腾讯全部卷入其中,将API价格降到无限逼近零。业内普遍认为,大模型创业公司的成本比大厂高,专用数据少,很难建立壁垒,无力与巨头打持久战。



出身相对“平民”的月之暗面和MiniMax,选择从C端入手,靠产品说话。


杨植麟说过,月之暗面不是为了竞争而建立的公司,不做to B,从第一天就决定做to C。


作为一个学院派创业者,杨植麟被认为是典型的“技术信仰派”,带有一点理想主义,相信scaling law,而不只是盯着眼前的竞争。


它去年10月推出的面向C端的产品“Kimi智能助手”,被网友称为ChatGPT中文平替,热度和月活一度逼近百度的文心一言。今年3月,Kimi宕机上了热搜,然后被股民盯上,炒作“Kimi概念股”,让这款产品加速出圈。


通过Kimi,月之暗面向外界证明了自己的技术实力和产品能力,为变现奠定了基础,随后推出打赏模式,但这块的收入还很薄弱。有意思的是,当时Kimi火了之后,阿里在第一时间宣布,通义千问免费开放1000万字长文档处理功能,超过Kimi。而当时阿里刚成为月之暗面的股东。


MiniMax应该是目前C端产品做的最成熟的大模型公司之一,它的突破口是AI情感陪伴。


第一款产品Glow,上线四个月收获500万用户,随后因涉及隐私和敏感问题遭到举报被下架,后来Glow以升级版本“星野” 卷土重来,去年底月活用户达到数百万人。MiniMax还开发了一款AI虚拟人物聊天软件Talkie,主打出海,上线一年时间累计下载超过1400万次。Data.ai数据显示,2024年4月,Talkie的日活跃用户数超过900万。


MiniMax很会做产品,非常精准把握了年轻一代的消费喜好。比如Talkie最大的卖点是AI角色定制,AI角色又与卡牌游戏机制相结合,这些卡牌不仅可以收藏,还能在平台上交易。Talkie让用户付费订阅,同时通过抽卡机制让用户充值,还在抽卡环节插入广告。


当其他大模型公司还在拼参数时,MiniMax已经找到落地场景并开始赚钱了。


百川智能切入市场的方式是开源。Meta靠开源在AI圈一炮打响后,百川智能选择跟随,在公司成立两个月后就发布了70亿参数的开源大模型,随后不断进行升级,通过开放API接口的方式进入ToB领域,开启商业化进程。


王小川考虑的问题很大,像大多数大模型公司CEO一样,他也还在探索最适合公司的商业化落地方式。


4 结语


站在今天的时点,评选“大模型四小龙”可能还有点早,毕竟,这个赛道还处在早期,存在太多变数。上文提及的四家头部公司之外,零一万物、面壁智能、阶跃星辰也都很有实力,只是暂时在估值、产品落地、商业化等方面略逊一筹。


现在大家都在等待超级应用出现,超级应用可能会成为改变行业格局的跷跷板。大模型公司们都在往这个方向努力,因为如果应用跟不上,商业化的空间就无法打开,靠融资推动的商业模式也就难以为继。


在那之前,“大模型四小龙”需要突破技术天花板,找到落地场景,平衡好与巨头们的微妙关系,甚至被迫参与价格战。它们面对的挑战,丝毫不比“AI四小龙”小。


文章来源于“定焦”,作者“黎明”