ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
大模型的扑克牌:独家内幕故事
6695点击    2024-05-24 13:04

大家都想“看看牌”。


中国投资圈一度熙熙攘攘的德州扑克牌局,忽然沉寂下去。


“反正我们圈子都不太打牌。”金沙江创投主管合伙人朱啸虎说,他和其他投资人的聚会已经从打德扑换成了品红酒,聊聊对行业和项目的新看法,也聊聊什么二级市场的股票比较好。 


现实中的牌局冷清了, 这些牌局上的精明老手却将他们的手伸向另一端。他们在中国大模型产业的局上,打起了一副沉默的牌。 


ChatGPT问世后,于2023年腾空而起的中国大模型产业,呈现出了许多你从未见过的奇异景观:一家公司首轮对外融资的估值就已高达10亿美元,刚上场没有任何产品就跻身独角兽俱乐部;


从第一笔融资起,一群举足轻重的大人物急急忙忙“抱团”集体下注;不管是红杉还是高瓴,阿里还是腾讯,这些曾在互联网的牌桌上互为排斥的投资方,这次欣然坐进一个股东会——你会看


到,中国创投的“打牌风格”在过去一两年已然巨变。 


“这是典型的Club Deal。” 一位一线投资机构的合伙人解释称。所谓“Club Deal”是指一组投资者组成一个“俱乐部”(club),投资者通常是私募股权基金、机构投资者或高净值个人,他们联合投


资于同一项目中。这类方式有助于分散风险,并凑齐更大资本盘——通俗来讲,就是, “一堆有头有脸的熟人,凑了一堆碎银子”。 


“这是典型的FOMO嘛,就是Fear of Missing Out,怕错过。”朱啸虎曾说道。这位曾经打德州以“手很紧、入场比例很低”为风格的投资人,一家中国大模型公司也没有投。他评价道: “因为大家


都不确定,所以大家Club Deal。” 


一方面,移动互联网的造富神话使一群人富裕,这些高净值个人有本钱,中国VC手上的现金也不少;而另一方面,由于对AGI前景的迷惘,所有人又都缺乏放手一搏的胆量,极少人愿意砸大


钱,更没有玩家筹码全下、All In。“说实话中国VC的钱不少的,主要是大家手都很紧。”一位投资机构的管理合伙人称。于是“我先放一点钱进去在里面看看”成了绝大多数人的共同选择。 


入局者多多少少怀抱着这样一种心态——数位不愿具名的中国投资机构创始/管理合伙人,用了近乎一致的表达来形容牌局中人的心理—— “大家都想看看牌。” 他们说。 


本文访谈了20位中国大模型局中的关键创业者、投资人与生态方,记录过去一年最完整的大模型资本内幕。 


01 开局


就在一年多以前,一位超级明星人物的重量级入局,令整场牌局一刹那热闹起来。 


2023年2月,从美团退休两年的王慧文(美团联合创始人)突然宣布重返江湖——成立一家叫光年之外,以做“中国OpenAI”为使命的通用人工智能(AGI)公司。 


事实上,在王慧文宣布创业之前的几天,他的想法曾一度剧烈跳跃。“他那段时间每天改变一次主意。”据彼时与他接触频繁的人士说,一开始,他是想拿5000万美元进行投资,摆在他面前有几


种可能性: 


一,只做投资人,5000万美金分散投给5个项目;二,他既亲自参与又做投资人,5000万美金拆开,3000万美元给自己买一张“船票”,2000万美元为其他人买两张“船票”,每人各投1000万美


元。

 

在投资人的撮合下,王慧文与同样处于狂热情绪、也宣称要做“中国OpenAI”的李志飞(出门问问创始人兼CEO)相约吃了一顿晚餐,席间充满了含蓄的试探。饭桌上的人想看看,王慧文为自己


买一张“豪华仓船票”的同时,愿不愿意给这位AI背景的前Google科学家,也买一张。但很快,这些不了了之。 


王慧文做出一个出乎很多人意料的决定: 他不仅要亲自下场,还要用5000万美元All In自己。 


“老王给自己买了一张‘全家票’。”一位同时接近王慧文和李志飞的人士在当时说,“老王说,全部放在自己身上,最放心。” 


另一位接近王慧文的人士说道:“老王最开始想投,后来他说投可能不行,聊了一圈觉得得自己做。自己做也不一定要当CEO。但显然老王不当CEO,别人当CEO压力很大。”因此,光年之外的


方案是,王慧文是CEO,对外寻找技术合伙人。 


创始人以2亿美元估值作价,个人出资5000万美元—— 以德扑看,坐“大盲”(Big Blind)位的王慧文一把抬高了所有人的下注筹码。这之后,5000万美元被认定为大模型公司起步标配。 后面的


人想来参与牌局,得掏出与之相当的价码。 


然而,这个资金量级不但没有吓退来者,反而让更多人闻风赶来。 


光年之外随即启动对外融资,这时,一群“有头有脸的熟悉脸孔”一起上了牌桌。 


“当时很夸张。创始人一般是一家一家见投资机构, 老王是面向所有有意向、发了Offer的投资人,统一做了一次路演。 后面基本像一个过程。”一位接近交易的知情人士说。这场大佬云集的“统


一路演”,就在位于北京搜狐网络大厦的光年之外办公室进行。 


源码资本创始合伙人曹毅是最果决下注的。他在王慧文尚且没下决心时就承诺,只要他入局,愿意拿出基金相当比例的资金额度,只为押注他这个人。于是,源码以6000万美元成为光年之外这


轮领投方。 


还有10多家机构和个人也参与本轮融资,可谓全明星阵容:包括但不限于红杉中国、五源资本、腾讯、真格基金、今日资本、顺为资本和宿华(快手联合创始人)、王兴(美团创始人兼CEO)


等个人投资者。由于各家机构都是一、二把手出马谈判,如红杉中国沈南鹏、今日资本徐新、真格基金戴雨森, 中国大模型资本局亦被称作“一把手工程”,场面颇隆重。

 

其实,这次出手违背了一些投资人的天然直觉。比方说,投资人看重创始团队缔结的牢固程度,而王慧文和与之组队的技术合伙人袁进辉、曹越,从前并不相熟;作为技术型创业,投资人往往


也会注重创始人的技术背景,而王慧文不懂大语言模型技术;更为紧要的是,这些江湖老手深谙一条法则: “历史上含着金汤勺出生的项目,没有几个是成功的。” 


虽然眼前这个项目正含着一把闪耀无比的汤勺,但此时此刻,他们抛开了这些念头。和曹毅的选择一样,他们赌注的是这个人——作为一名超级产品经理、连续创业者和一家市值最高达万亿港


币企业的二号位,王慧文实在太富有诱惑力了,这点足以令所有人安心。 


“当时融资,光年之外要好太多了,是最快估值到10亿美元的,而且都是投资机构一投一大笔,几千万美元这种。”一位接近多家大模型公司融资交易的人士回忆道,“就像源码投了几千万美元,


宿华投了几千万美元,都是那种All In的姿态。其他公司应该没这样的。小川那边刚开始几百万美元都拿,原来没有很大的机构。” 


据多位知情人士,由于各方的热情极为高涨,首轮对外融资总意向认购金高达5亿美元。但王慧文没要那么多,他将融资额控制在了约3亿美元。 


就这样,光年之外在没有完整技术方案和任何产品的情况下,资金迅速筹措完毕,投后估值一把冲破10亿美金。 


此刻,还有许多也有志于中国AGI事业的创始人正对标着光年之外估值,到市场上募集资金。不管是与王慧文同一时期起步的月之暗面创始人兼CEO杨植麟,还是比他晚了一步入场的百川智能


创始人兼CEO王小川,他们的开局都不像光年之外那么顺遂。其中一个原因是,“王慧文融了太多钱”。 


“你得接受,这是一个现实。”王小川说。他将王慧文的开局优势,部分归结到后者在商业上的老练——“美团是从死人堆爬出来的公司。”——但战术并非赢面的最关键。 对于这些“久经沙场”的交


易老手,他们愿意在风险世界中承受风险、第一时间下注,根本原因有且只有一个:王慧文帮更多人赚到过钱,而这些人还想搏一把大的。 


“很多人是想买张门票。”一位场上的投资人说。 


不仅在资本层面,王慧文凭借个人影响力,第一时间也笼络了优渥的算力和人才。资本、人才和算力,是大模型创业三要素(算力也取决于资本)。据透露,彼时光年之外已搞定4000余张卡,


是同期创业公司最充足的。 


倘若将王慧文视作场上“打牌的人之一”,将光年之外视作他拿到的一对“手牌”,将融资额视作“筹码”。牌手王慧文开局拿了最大一对“手牌”和很深的“筹码”。 


“2月到3月,很多人都在发愁融资,光年之外这边很快就搞定了。”一位接近光年之外的人士透露称,然而,当生产要素齐备,“就要开始工作了”,令所有人始料未及的是—— “他反而出状况


了”。

 

02 转牌


德州扑克是概率游戏,手牌大也有可能沦为输家,手牌小也有翻盘几率。 


在很多人的日后回忆中, 王慧文毫无预兆的“疑似抑郁”,都源于他太负责了。 一位员工记得,自2023年2月,在光年之外组建最初的三个月,王慧文一直处于亢奋又疲劳的工作状态。这名亿万


富翁,住在距公司不远的自如,每天早晨到公司最早,晚上离开最晚,周末也几乎不回家,开会到深夜十一二点——人们又一次看见了他创办美团的拼尽全力,不同的是,“可能身体吃不消


了”。

 

时间抵达5月。光年之外的资本、人和卡陆续就位,只是,当创始人把目光转向具体的大模型业务,隐患真正浮现。 


王慧文提出大模型技术和产品并进的“双轮驱动”战略。他们的分工是,王慧文带产品团队,联合创始人袁进辉、曹越带技术团队。虽然技术问题有联创分担,但是, “作为一号位,老王要形成高


质量的决策”。 而关于大模型的关键决策个个艰涩,又个个价值连城。行业外的人需要在极短时间补充大量技术知识才能形成一个有效决议,而对于业内资深的人,可能是听从本能和直觉。 


比如,“几个月之后,算力市场是什么行情?租还是自建算力更合理?”这类决策试错成本极昂贵,有可能,“一下子就投出去十个亿,融资一半就出去了”。“老王又很负责”,这些都给了他压力。 


综合多位光年之外的人士复盘,王慧文很靠谱,他想把这件事想清楚,但到了科研层,远远超出他的能力圈。大模型一个决策就要花至少1亿美金,而他不能确认这条路是正确的。 “对老王来


讲,他无法消解这个压力。” 一名人士说,“跟互联网不一样,不会有人怀疑做滴滴做不出来,或者做拼多多做不出来,最多只是说我运营不好。但AI有很多科研属性,就会出现——我不知道这


件事怎么做。” 


从内部看,5月,他开始出现晚上睡不着、白天难以集中注意力的症状。“也没有特别的一件事导致,只能说,干具体的业务和之前的兴奋状态不一样。要一步步地把具体技术搞扎实,把产品搞


出来,这中间又有无穷的问题。”还有一点是团队管理。“这些大模型公司都有这样的问题,这么快组建团队,100人掺在一起,以前这100人也没在一起工作过。老王又是管理比较细的人。”上述


员工称。 


6月,王慧文“疑似抑郁”的消息传出。国产大模型之间剑拔弩张, “有的公司直接冲到光年之外办公室挖人”。 正当外界错愕时分,美团宣布以约20.65亿元人民币价格收购光年之外。 


“那个是一瞬间的事。”一位光年之外的投资方说,从他们得知CEO生病到退钱,“整个过程应该也就一天”。故事的结局大家已经熟悉:创业伙伴王兴救场,通过收购光年之外把投资人的钱退回


了他们的口袋。 


如果说王慧文高调加入战局,凭借一人之手推高了中国大模型创业公司的整体估值和融资额;那么他的离开,又间接促进了其他几家公司的融资进程。 


前述了解多家大模型公司融资的人士评价称:“光年突然没了,其他大模型公司马上就有钱了——投资机构总要选——现在,突然少了一个强劲的竞争对手。” 


2023年中光年之外的退出,成为中国大模型牌局里截至目前, 最令人惊诧的一次“转牌”。 场上局势快速发生变化,仅仅半年后,牌面格局就大不一样。 


一位光年之外人士事后感慨说:“老王的一个idea,改变了很多人的轨迹。” 


03 玩家


若将创业选手比作德扑玩家。现在,牌局之上有6名“玩家”。他们每个背后都站着一众中国对通用人工智能野心勃勃的机构与个人,由他们提供这场牌局的“筹码”。 


场上6家大模型创业公司是:1、张鹏任CEO,唐杰任首席科学家的智谱AI,2、闫俊杰创立的Minimax,3、杨植麟创立的月之暗面(Moonshot AI),4、王小川创立的百川智能,5、姜大昕出


任CEO的阶跃星辰,6、李开复创立的零一万物。(先后顺序按公司成立时间) 


与光年之外在同一时段起步的有两位:一位是AI研究员出身的90后科学家杨植麟,另一位是由搜狐孵化并分拆的搜狗前CEO王小川。前者于2023年3月创立月之暗面,后者于4月携搜狗班底宣


布创立百川智能。很快,王小川就被锁定为王慧文最直接的对手。 


王小川也是企业家出身,与王慧文年纪相当,都毕业于清华,又都在中国互联网的战场冲锋——相似性增添了两个人竞技的味道。从结果看,中国明星基金彼时几乎都把筹码押给了光年之外。 


正当光年之外以10亿美元融资时,王小川刚以5亿美金估值拿到5000万美元开局的启动资金。“百川第一轮没有什么机构投资者,都是个人。”一名知情人称,这笔资金来源是王小川和他的朋友


圈,如陈大年(盛大集团联合创始人)、张邦鑫(好未来创始人兼CEO)——朋友圈为他提供了上场筹码。 


“去年是快速rush(行动)的一个状态。”王小川复盘道,由于入局较晚,“我们在人才争夺、资金争夺里,肯定是偏晚的一个”。所以, 入场时,他采取了商战中的“跟随策略”。 “不高级。”他说,


“至少在商业上有一个简单逻辑——如果对手比你成熟,你跟着学就行了;但在你的优势领域,你发挥得更好。”在他看来,自己的主战场是技术,“本质上美团的成功不是技术推动”。 


据王小川透露:“在第一轮有一线投资基金愿意投我们,甚至觉得我们价格很好,但因为我们对标学习拿朋友圈的钱,就没有去拿VC的钱。我的选择是比较简单,就是面向入场,先follow。” 


在筹集资金的步伐上,百川比光年之外慢了一步。它于2023年10月才完成第二笔3亿美元融资,依然少见VC身影——不过这次, 它呈现了“战投为大”的特征 ——投资方包含十多位,腾讯、阿


里、雷军系的小米/金山/顺为资本、好未来这些战略资方结伴而来,此外还有清华控股、深创投和红点中国等。王小川谈到,不同于王慧文通过美团上市帮VC挣得盆满钵满,他真正赚过钱的恰


恰是大企业。“我给赚过钱的公司是搜狐、阿里,包括又把搜狗卖给了腾讯。” 


所以,资本衡量这两位企业家的标准非常简单:谁帮更多人赚过更巨额钞票? 


就在王小川与王慧文正面交锋之际, 杨植麟创立的月之暗面仅仅是一个弥漫着“非共识”的“水下项目”,估值也最便宜。 


杨植麟毕业于清华和卡耐基梅隆大学,学术和工作很多与大语言模型技术相关。他的风格更偏硅谷,公司只做to C产品(Kimi智能助手)。虽然杨在AI圈有些名气,但与一众知名企业家、科学


家、高管相比,又显得籍籍无名。 


事实上,一开始,很多人更愿意把他视作CTO式的人才——2023年初,有人拉着杨植麟与王慧文聊过,看杨是否愿意出任后者的技术合伙人,他没有同意。 


“在那个时间点,觉得他适合是非共识。”一名月之暗面的投资人说,更普遍的观点是,杨植麟年轻,上一家创业公司又不十分有名,“而且很多人觉得在中国,你技术好,有用吗”? 


“我们是把他从水下挖出来的。”另一位月之暗面的投资人说,“当时在这个圈子聊,会时不时听到他(杨植麟)—— 有的人说他挺厉害的,有的人稍微有点不服气。 听到第三次的时候,我觉得


这个人很重要。” 


在杨植麟的项目上,嗅觉最敏锐的当数红杉中国,它是杨植麟上一家创业公司股东。2023年初,红杉就意识到杨也许是适合大模型赛场的创业人选,双方一拍即合。但在究竟是红杉一家投还是


多家投的问题上,几经波折。 


接近该笔交易的人士称:“最开始红杉报了大约1亿美金估值,但植麟发现1亿美元融3000万美元不够,稀释30%没法弄了,后来提高到比如2亿美金估值。”交易已经准备close(关闭)了。 


没想到的是,今日资本突然“杀”进来。 


“他们‘抢地’,很凶猛,估值越抬越高。”多位知情人士道,他们一举把估值推高至3亿美元。为了抢交易,今日资本试图说服杨植麟:你应该多拿,你应该都拿。又过了几周,“砺思和FunPlus


(游戏公司趣加)是最后一刻进的第一轮”。 


“今日提高了所有人的估值,除了红杉。”数名知情人透露。最终,这笔交易分两次以不同价格交割,红杉先以2亿美元估值,其他人再以3亿美元估值,总计,月之暗面完成6000万美元开局融


资。 所以,就在光年之外一上场就踹开独角兽大门、百川智能以5亿美元估值实施跟进计划时,月之暗面以2到3亿美元估值拿到了上场筹码。 


杨植麟回忆道,对他们来说,这轮融资的关键是时间窗口。2023年2月,公司尚未成立,他在美国调研时,就启动了第一笔融资。“如果delay(延迟)到4月,基本没机会了,真正窗口就是一个


月。”他这时做了一笔演算,“算完觉得至少要在几个月内拿到1亿美元”。 


刨除三位同期上场的选手,Minimax和智谱AI是成立更早的大模型公司。 


智谱AI可谓“根正苗红”,2019年脱胎于清华大学计算机系知识工程实验室,独立创业。早期投资方有启明创投和君联资本。总体而言,智谱AI偏人民币风格。张鹏称,大模型给了这代AI公司一


个机会:做“技术平台化公司”,而非“顶天立地的垂直公司”。 


站在2023年初始,唯一能在融资上与光年之外抗衡的是Minimax。 这家成立于2021年、核心班底来自商汤的初创企业,这时已有相对成熟的技术和产品,并且来到第三轮融资。 


闫俊杰出生于1989年,毕业于中科院,在商汤从实习生做起,一路擢升副总裁。他曾是商汤智慧城市事业群CTO,该业务为公司重要收入来源之一。“他是第一个和我讲Foundation Model(基


础模型)的创业者。”云启资本合伙人、Minimax天使投资人陈昱说,双方早在2021年1月接触。“他们现在有这么一个‘锤子’(Foundation Model),他们明白公司要长大,是要把合适的‘钉子’找


到。” 


在他看来,闫俊杰是“very rounded(全面)的一个人”。陈昱称,在最早与闫的接触中,他们不但讨论技术,也考虑商业化——讨论过数字人、智慧城市和在博物馆做三维重建的项目。 


据其多位股东透露,Minimax早前已完成两轮融资:第一轮是2021年国庆前后,它以2亿美金估值完成2000万美元融资,投资方是高瓴、米哈游、IDG和云启资本。 “当时他们见了张磊(高瓴创


始人兼CEO)和李良(高瓴投资创始合伙人),就直接拍了。高瓴定的价,其他人只能follow。” 


第二轮是半年后,2022年5月,它又以5亿美金估值完成5000万美元融资,投资方是上述老股东加明势资本。 


所以,在ChatGPT点燃全球热潮以后,Minimax很快就成为中国第二家跻身独角兽阵列的选手。2022年底到2023年4月,它以大约9亿美元投前估值迅速筹集2亿多美金,投后估值近12亿美元。


除了老股东,在第三轮融资中,列队入场的投资者有绿洲资本、腾讯、小红书和顺为资本。 


相对月之暗面偏to C,智谱AI偏to B,Minimax更像“混合派”——既做很多to C产品,又做to B;既做国内,又做海外。事实上,Minimax的产品经历过几次调整:从最开始的数字人到AI社交产品


Glow,而后它作为App工厂,推出了海螺AI、Talkie、星野等产品。一位老股东对其发展流露出几分惊讶之色,他的表达是:“Surprisingly good(出乎意料地好)。” 


除此外,另两位选手是阶跃星辰和零一万物,分别于2023年4月和5月成立。 


截至2023上半年, 6名“玩家”已全部就位。 他们起步时间不一、创始人与公司基因迥异,但他们都赶上了资本愿意密集投入中国大模型事业的黄金时间。当然了,这很大一部分得益于资本们前


所未有的恐惧——害怕错失技术变革的FOMO情绪;以及旺盛的贪婪欲——AI或许是比移动互联网更磅礴的商业巨浪呢。比他们晚来的人,这样的时间窗口和心理窗口双双消失殆尽。 


然而,此刻中国大模型牌桌上,6名“玩家”胜率和赔率还相当模糊。 


“大家都看不清楚。”一位一线投资机构创始合伙人说,于是,许多投资人做出了十分一致的选择: “每个人放一千万美金到几千万美金,看个牌。” 


04 下注


大模型给中国带来了一场极特殊的资本盛宴。 


一方面,它诞生于一系列的逼仄与夹缝中——更紧张的国际关系,更有限的资金,更狭窄的退出通路,更审慎的投手,更稀少的创业者;另一方面,它却支撑着一个足够宏伟的科技愿景。 于


是,场上的人兴奋又脆弱。 


兴奋在于,这或许是当下唯一符合美元VC审美的资本故事。“谢天谢地,不然我真觉得没事干了。”一名投资者这么形容AI浪潮爆发后的心情。“从自动驾驶和O2O以后,很少有这种单轮大几亿


美元量级的融资。”另一名投资者称。 


而脆弱则在于,大模型公司面临的风险实在太大,一旦科研宣告失败,又或巨头碾压,这么多钱砸下去甚至连水花都看不见。 


在此情境下,VC群体性心态转变了。一位基金合伙人这么描述他们的心理:“大家想投,又担心投多了打水漂”,于是做法就变成:和创业者保持密切联系,投一点钱、先看看牌。“很多基金


想,我只能投一个1亿美金,所以等等看。宁可贵一点投,我要一个确定性。”——这就导致,在很长一段时间,投资机构以一种不可思议的“凑份子”的态度、“你一千万,我一千万,他一千万”、


满怀踌躇地押下筹码。 


即便心态有相似处,但各机构出手的时机、策略和价码,大不相同。 


据多位核心投资人称, 红杉是VC中最凶猛的。除了光年之外,它在如今场上的6家中下注4家,包括月之暗面、智谱AI、Minimax和阶跃星辰。 


红杉出手集中在2023上半年。“他们是不能miss的打法。”业界将此投资风格归类为“赛道覆盖”。彼时,红杉创始及执行合伙人沈南鹏会事必躬亲,亲自约见大模型创业者。就在其他基金还在几


家初创公司中摇摆时,红杉在多个创业局里放了钱。 


就像上文说的那样,红杉顺理成章地成了月之暗面天使投资人;但在Minimax的局上,它进入得则没那么容易—— 这家公司的董事会中,坐着红杉的老对手,高瓴。 


“高瓴不是不让它进,只是不想让它这么早进。” 一位接近Minimax的人士说。戏剧化的是,红杉的入局源于一起意外。 


2023年中,字节跳动上场寻觅大模型标的,它此时正在思考投资的可能性。“它当时考虑了两家,一个是Minimax,一个是阶跃星辰。”随后,Minimax以投前约16亿美元估值,为字节单独开了


一轮,这本来是Minimax的第四轮融资。“至少我们见到SPA(股份认购协议)了。”一位Minimax的投资人说。但没想到的是,字节临场反悔了——他们决定“要么自己做,要么收购一家公司”。 


“第四轮是字节毁了SPA,红杉就顶上了。” 他说。 


所以,红杉以相较昂贵的价格挤进了Minimax的局。“那个阶段很多是看不清的。谁也不能在那个时间点说,谁谁一定行,只能做当下最好的选择。当每种可能性都有可能成,你只能赌可能性最


高的那几种。”一位场上人士分析,“万一Minimax好呢?” 


从内部看,红杉覆盖型策略与其管理机制有关。他们投资人人数多,投每个项目需要一名合伙人sponsor(支持)。在红杉,4个项目分散记在不同合伙人及团队名下——据多名接近红杉的人士


称,月之暗面是郑庆生,智谱AI是郭山汕,MiniMax是郑庆生,阶跃星辰是孙谦—— “Neo(沈南鹏)兼听则明。”一位业内人士道。 


实际上,虽然很多机构都想“看牌”,而各家能负担得起的“看牌费”截然不同。 


谈到“看牌费用”,一名基金的合伙人算了一笔账:假设红杉(美元)手上有大约9个billion(90亿美金),1亿美金约等于它基金规模1%,“所以它给0.5个点、5000万美金看看牌是可以接受的”。


而有的基金管理规模是几亿美元,这种情况下,“lost 1%,就是几百万美元,这是能承受的看牌费的极限”。从这个角度,这些机构的几百万美元大概等价值于红杉的1亿美元——口袋深浅决定


了看牌费的多寡。 


不过, 与红杉实力相当的高瓴就没有采取“广撒网”策略,而是只出手了两家。其中,高瓴从天使轮重注Minimax,同时也在智谱AI里放了钱。 


红杉与高瓴在投资策略的上反差,一部分或许取决于双方对市场终点的猜想不同——一位业内资深人士提出,中国大模型究竟会不会是一个赢者通吃的行业? 


第一种可能是,会。若如此,无论如何不能错过,因为“一旦你错过,你基金的收益和别人天壤之别”。第二种可能是,不会,市场份额不集中。“这时候你是都投,还是投其中一两家,收益没有


显著差异。赌中第一名的人收益可能比你多20%,仅此而已。” 


“现在问题是,大家说不准是第一种还是第二种。”上述人士接着说,高瓴也许倾向于第二种——国内大模型公司尚且处于复制OpenAI阶段,“没什么妙招让他们一步登天”。 


看完了中国VC“最深的两个口袋”,我们来看另一波基金。他们射程和口袋深浅各异,但都做出一个共同抉择: 向更早期投、向最早期投。 


“在大模型,投得好不如投得早。”一名大模型公司早期投资人称。(就连红杉、高瓴都阶段性采取了此策略。) 


今日资本是使用该策略出手活跃但低调的一家基金,它接连下注了光年之外、月之暗面和智谱AI。其中,在光年之外和月之暗面上押注了第一轮。真格基金也押注了光年之外与月之暗面第一


轮。值得一提的是,今日资本虽“筹码多”,但从2023下半年出于风险的权衡就收手了,再未加注任何一家大模型公司——“他们的指导思想是不投。”业内人士道。 


“大模型投资,最佳活动窗口就一个月(2023年2月到3月),过了那个月估值迅速贵很多。”另一位早期投资人说,“这种长线的赛道(人工智能、自动驾驶),在第一年、第三年甚至第五年投都


有风险,你还不如早早天使就投进去。”在他看来: “风险没有因为估值增长而发生本质变化——你早期放钱,是用更少的钱买到同样的筹码;在后面要花更多的钱买筹码,而风险没有降低。” 


一级市场的交易者是高风险的承担者,他们时刻都在心里盘算胜率和赔率,据此选择出手时机与交易策略。 


场上也有一些不同寻常的出手方式。 由前红杉中国合伙人曹曦创立的砺思资本(Monolith),是一家成立仅两年的新锐机构。曹曦倾向于只选择一家最看好的公司下重注。 


曹曦事后回忆道,2023年初,他拿到了几家初创大模型公司的投资机会。他的想法是,“先确保有资格上牌桌,再谈资金有限的情况下,该选哪个”。曹曦琢磨了整整一个月,做出一个在当时异


常艰难的决定:在市场热情高涨时,他在几个明星项目里没有放钱。 


接着,他找到偏年轻的杨植麟,接连投资了月之暗面一、二、三轮。到目前,这家新基金以约3800万美元的投资额,上升至月之暗面第二大VC机构股东(第一是红杉)。 


投资与德扑具有相似性。两种活动中,“玩家”需要从手中的牌、场上有限的信息计算概率,和参与者的行为与心理博弈,随之做出下注决策。随着场上信息逐渐充分,筹码愈来愈重,“这不就像


每一轮投资”?并且,“玩家”也需要管理筹码,合理分配,不能因为输掉一手牌,招致损失过大、功亏一篑。 


在德州扑克游戏中,玩家会把德扑风格归纳为:紧凶 (Tight-Aggressive)、紧弱 (Tight-Passive)、松凶 (Loose-Aggressive)、松弱 (Loose-Passive)。曹曦表示自己德州打得不多,主要是为了交


朋友,但很喜欢拿德州举例。如果是投资,他希望保持的风格“肯定是紧凶” ——“不投那么多,有一个觉得可能胜率高的,下比较重的注。” 


游戏中,紧凶型玩家手牌选择严格,只玩高质量的起手牌,一旦决定进入游戏,会积极下注和加注寻求主动权。 


不过,曹曦强调, 投资是严肃的商业行为,以德州扑克比喻只是为了形象化的表达,便于理解。 此外,这两者有一个根本性差异。“德州你扔掉的牌就扔掉了。投资你前面每一次fold掉的牌,


后面还能买回来——你A轮没投,B轮可以投;B轮没投,C轮可以投。”他称,“所以,Swallow your ego(放下自我),错了就认,认了再上”。 


此外,场上还有一些投资机构之前不愿出手,他们想等待更明朗的牌面。 


比如,经纬创投2023年没有下注。数位接近经纬的人士称,他们考虑的是,放几千万美金看牌不是其喜欢的玩法,他们希望等局势更明确,笃定地赌一家——“在一家最后投5000万甚至更多”。


经纬从自动驾驶赛道得出结论,应该先想清楚 “谁是理想汽车” 再出手,这样可以以一个本体企业为抓手覆盖产业链上下游。 


不过,就在2024上半年,我们从多方独家了解到,经纬终于出手了——它把钱放在了Minimax上,“挺重注的”。 


一上场就把筹码重注光年之外、领投该公司的源码资本,因为光年之外的退出而被动从牌局抽身。之后,它没有立即重新下注。也在2024上半年,源码把钱放在了月之暗面上。 


新近准备出手的还有高榕创投,在持币观望1年多以后,它可能将把钱放在月之暗面上(交易尚未正式签署)。 


一个有趣观察是,在这轮大模型浪潮中,积极出手的除了基金一号位,有许多80后投资人。他们或已晋升管理合伙人,或为合伙人。如,经纬王华东、云启陈昱、启明周志峰、砺思曹曦等。他


们更具雄心,渴望凭借一场冒险,将投资生涯推向高峰。 


然而,在场外,有一名颇特殊的投资人。他是这么评价自己的:“我现在很少打牌,所以我现在不太愿意看牌。像我手很紧,看牌都很谨慎哈哈哈。” 


他评价同行道:“反正他们也无所谓,他们钱多,说实话。 大家都是放点钱看看牌,都是这个心态。 ” 


所以,朱啸虎丝毫不愿理会牌局的喧嚣,他既不看牌也不下注,摇摇头走掉了。 


05 Club Deal


大模型产业一把改写了中国创投交易的游戏规则。 


与硅谷VC“近乎全线miss大模型投资”、“大模型全是巨头支持”的景象不同,中国VC在过去一年和巨头一起积极出手,支持了国产大模型公司从0到1之路。他们愿意出手的原因很简单——“因为


美国有对标。”拾象创始人兼CEO李广密说,“我们擅长解题。”


然而,在这场牌局上,“牌手”的出手风格呈现了清一色地转变。


这一方面受制于全球经济的低垂,更重要的是,AI耗费的资本量太过庞大——单笔融资高达数亿到数十亿,很大一部分要拿来做高风险的科学研究。所以,VC 过去“以小博大”,“从Early Stage


(早期阶段)到Growth Stage(成长期阶段)击鼓传花式”的投资策略,失效了。


“最经典的VC逻辑是每个支票开500万美金以内,我开十个才5000万美金,虽然每个都有很高风险,但十个里头总有两三个成了,这就是一个巨大杠杆。”清流资本创始合伙人王梦秋说,“现在融


AI的deal,因为我单个deal check size(支票规模)开得大,所以从第一天起就是Club Deal(俱乐部交易)。”这意味着,这些大模型公司,投资名录上不会只站着零星的一两位股东,而是跟


着一大把——“大家一拥而上”,“每个人都在分散风险”。


资金的分布改变了牌局隐藏规则。“因为所有人的钱只够分散到几家,就会变成,一个项目本身在这个赛道的竞争对手就少,最后可能剩2-3家甚至只剩1家——所有人都不会觉得1家都成不了


——那么,我有1/2、1/3的(胜出)机会。”王梦秋称。


于是你会看到,在大模型赛道上,涌现出6家创业公司展开角逐。对于他们每一家的融资结构,Club Deal现象都很显著。以融资额最高的月之暗面举例,它至今已完成三轮融资:


第一轮是2023年上半年,它以估值2到3亿美元,完成6000万美元融资,5名投资方联合出手:红杉中国、今日资本、真格基金、砺思资本和FunPlus。


第二轮是2023年下半年,它完成约2亿美元融资,投后估值约7亿美元。该轮有战投入场,美团龙珠、阿里和蚂蚁领投,跟投方众多,包括宿华、砺思资本、九安医疗、蓝驰创投、襄禾资本等。


这年底,月之暗面额外开了一小轮(相当于第二轮的+轮)。“进来了两家公司,五源和云九,是不多的钱。”一名知情人士称,他们彼时是持有“看牌”心态的投资者。



直到2023年末,月之暗面总计融资额不到3亿美元,在资本竞技中呈落后之势。春节期间,一起特殊时间点的超级交易帮他们扭转了战局。


2024年大年三十的夜晚,紧张的商业谈判持续到了最后几秒,这是月之暗面第三轮融资文件签署的最后期限。“因为老股东很多,大年初一00:00点左右才没有意见,那天算文件close day(交易


日的结束)。”这时,月之暗面完成超8亿美元融资,阿里领投、砺思跟投,投后估值超25亿美元。不过,第三轮到这里没有结束。


“赶在过年前close的,只是这笔交易的一部分。”数位知情人透露,“它还有一个条款,接下来60天可以再拿2亿美金。”据了解,最终,该公司第三轮总计融资额略超10亿美元,是中国大模型迄


今最高单笔筹资金;目前它正以投前30亿美元估值进行第四轮融资。


短短一年,这家公司从默默无闻中崛起,估值翻了15倍,从“筹码”最少的选手变成了最多的之一。


在场上,阿里巴巴是2024开年以来最大变量。我们结合多方了解到,月之暗面与阿里的谈判耗时很短。为了促成这笔交易,双方在交易上做了一些特殊设计:


1、阿里的投资额中,有一部分放在共管账号,用于购买阿里云服务;2、月之暗面创始团队有超级投票权(Super Vote);3、阿里占据一席董事会席位,但在融资、并购等财务条款上,不具


有一票否决权(Veto)——这意味着阿里不能阻止其他投资方进来。


此后,阿里的野心未止步于月之暗面。数天后,它进一步注资Minimax。这是Minimax的第五轮融资,它完成超6亿美元融资,其中阿里领投约4亿美元,投后估值超25亿美元。据其股东透露,


这笔融资无限制性条款。


一位战略投资方这么点评2014上半年的形势:“光年之外如果不倒,会是独特自己一个梯队往上,其他人在一个梯队。今天那个梯队没了,现在其他人的梯队里变成了,有一两家更Outstanding


——而这个Outstanding,是阿里作为裁判评价的。”


“大家现在已经看清楚了。”陈昱说,“融不到大钱,你就没有算力,你就做不出最好的模型——这就是大模型的一个现状。”不过,越往后走,VC越显得无能为力,中国大模型事业要倚赖巨头之


手。


巨头中,阿里巴巴出手较晚却是最激进的,投资了场上6家选手的5家——月之暗面、Minimax、智谱AI、百川智能和零一万物。


多位基金GP(管理合伙人)分析,阿里的激进一步,与有投资背景的吴泳铭上任和阿里对云业务的重视有关。“吴妈(阿里集团CEO)新官上任,更果决,更愿意出手。”此外,阿里亟待变革的


现实也是逼迫它的动力来源——一名GP称,阿里在移动互联网的船票没完全守住,拼多多、抖音正凶猛进攻电商腹地,“AI是一张续命的票”。


除了光年之外,腾讯投资了Minimax、智谱AI和百川智能等。“腾讯是先看一看。”一位同时接受了阿里、腾讯、雷军系投资的大模型公司CEO说,“他们很明确地表达,我们自己会做模型,但是


我们也担心自己做不好,把这个机会丢掉了,所以我们也投。”


雷军系和美团在心态上更接近腾讯。雷军系(包括小米、金山、顺为资本等)下注了光年之外、百川智能、Minimax、智谱AI、月之暗面。美团除了收购光年之外,投资兵分两队——美团战投


下注了智谱AI,美团龙珠下注了月之暗面。不过,据接近美团高层的人士说,王兴的心态偏学习和观察。


与这些公司“自研+投资”双管齐下的策略不同,字节和百度现阶段赌注自己做。


还有许多知名企业家也在积极接触大模型公司。他们或出于战略进攻,或出于战略防守,又或者只是希望参与到AI变革之中。他们在牌桌上空“盘旋”,思考策略并等待最佳时机。


你会看到,中国顶尖的企业家、个人投资者与机构,齐聚这场大模型的顶级牌局。他们放下了过往恩怨,以一种抱团而非排他的策略,集体出资。Club Deal也体现了今时今日中国创投的实用


主义倾向。


“现在大家赚钱很难,也承担不起多少损失,所以只投最好的。但最好的人是很明牌的人,估值就变得很高。”一位投资机构管理合伙人观察说,“这就变成了,大家都Fly to quality。”(Fly to


quality是指,市场不确定性增加或风险厌恶情绪上升,投资者倾向于购买质量更高、风险更低的资产。)


王梦秋甚至觉得,“VC(Venture Capital、风险投资)这个概念已经不成立了,我们不是Venture,我们希望尽量不要冒险。”她说,以前VC依靠非共识挣钱,现在则不然。“因为市场上钱有限,


必须大家都相信一个方向,才都愿意持续投钱。”这致使,VC依赖共识才能挣到钱。


这是一起特殊时候的中国特殊的资本故事——它沉默又喧嚣、萎靡又阔绰、团结又精明,充满了矛盾感。


值得注意的是,今天这些“玩家”手中,都还有一张“小牌”:他们的模型能力尚未证明超过海外开源模型的水平。


同时,10亿美金级的融资额于全球模型竞争而言,仍可谓杯水车薪。


据统计,OpenAI总计融资额超百亿美元,最新估值超800亿美金,比中国公司多出一个数量级。


过去一年,就在中国长出6家大模型独角兽的同时,美国已出现多个巨头+模型公司的深度联盟。如,微软+OpenAI、亚马逊+Anthropic、Google自成一派、特斯拉+xAI。业界认为,为了获得相


对无限的资本与资源,模型公司与巨头绑定是可预见的出路之一。


对此,中国一部分投资者的心态悠悠然出现一丝变化。巨头的大手笔一方面增加了VC的安全感,而另一方面,对于模型公司有可能被巨头吞并的命运,他们又感到失落。几位投资人做出类似


表述:他们希望赌注“一个风险极大、回报极大的公司”,他们渴望捕获一个千亿美金甚至更大的巨型独角兽。


但若是,一家创业公司最终以50亿美元甚至100亿美元卖给巨头?


“我也能理解。”一名投资者说,“对我来说,这是一个很成功的失败,并不是一个失败的成功。”


大模型的扑克牌中,复杂的是模型,更是人性的博弈。


文章来自“腾讯科技”,作者:张小珺




关键词: 大模型 , 王慧文 , AGI , 光年之外
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales