ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
4年百亿估值,国产大模型创业TOP 1,清华造
7566点击    2023-10-23 13:22

大模型公司智谱AI,一举宣布了年内融资额:25亿元人民币。


如此数额,什么概念?刷新了国内大模型创业公司的累计融资额,估值超过百亿。


这家成立4年的公司,已经成为国产大模型最具吸金力、最具价值认可的公司。



在百模大战来到见真章的“生成式AI第二阶段”,领头羊智谱的融资进展,是否也是行业马太效应显现的证明?


被看好的公司会获得更多的资源,没有证明自我价值的公司则面临洗牌和无缘下一阶段竞速。


从创业公司的维度来说,这更像是大模型创业的上半场尾声,格局分水岭已现,生态座次开始分明。


为什么是智谱?


在弄清国产大模型融资强者为什么是智谱之前,我们先溯本求源,知其来处。


在此之前,它大概属于圈内知名,圈外无名的状态。


智谱AI,成立于2019年6月,由清华大学计算机系知识工程实验室(KEG)的技术成功转化而来。


核心团队成员几乎都是清华血脉,其中,CEO张鹏毕业于清华大学计算机系,是清华大学2018创新领军工程博士。


在KEG实验室时,团队主要进行研究如何把机器学习、数据挖掘、知识图谱等应用到工程实践中,并且从2017年开始训练AI模型。



到了智谱成立一周年那天,恰巧OpenAI发布了GPT-3。


从那时候起,智谱公司上下开始全情投入大语言预训练模型的研发。在大模型的道路上,OpenAI选择了GPT,谷歌选择了BERT,而智谱选择了GLM(General Language Model)


种瓜得瓜,后来几乎所有的故事都围绕智谱独特的GLM预训练架构展开:


2022年,智谱和清华合作研发了双语千亿大模型GLM-130B,把它作为基座,开始打造大模型平台及产品矩阵。


2023年,智谱动作非常频繁,从推出对话模型ChatGLM同时开源单卡版模型ChatGLM-6B起,相继视觉模型Visual-6B、代码模型代码模型CodeGeeX2、数学模型MathGLM、多模态模型CogVLM-17B、Agent模型AgentLM系列,并且统统开源。


今年8月31日,智谱基于中英双语对话模型ChatGLM2的生成式AI助手“智谱清言”,成为了首批11家通过备案飞入寻常百姓家的大模型产品。


可以说,这几年来,智谱在大模型领域主要做的事情很明晰,就是一手夯实地基(基座模型),然后在地基上搭建各种模态和功用的建筑。



值得一提的是,智谱从雏形时期就能用B端服务能力养活自己,这是这家公司面对“大模型花钱如流水”的公认现实不仅不畏手畏脚,还频繁研发推出新模型新产品的底气。


当然这不是唯一原因。


除了服务能力和与之伴随的营收能力,智谱还拥有过硬的人才队伍和技术实力。


上面已经提到,智谱脱胎于清华,而“清华系”已经成为这个领域一种颇具威望的标签


究其原因是清华计算机系投身大模型研究较早,有着长期经验,培育了许多人才——现在市场上叫得上名字的玩家,以智谱为代表,以及如月之暗面、深言科技、一流科技、百川智能、面壁智能、衔远科技、生数科技等,都是清华血脉。


他们所发表论文的被引用数、所发布模型的可验能力,都是对这个“公认标签”有力证明。


而且据公开资料,智谱是唯一全内资国产自研的大模型企业。


这样的公司底色,让智谱在“模型安全、数据安全、内容安全”不绝于耳的讨论和争议声中,有着自己的准备和策略。


据悉,为配合国产GPU发展,智谱现在在落地GLM通用语言模型国产芯片适配计划


具体来说,就是和国产算力芯片厂商一起合作做模型算法适配,在算法端推理端适配国产芯片,目前可适配的国产芯片已有近10种。


融了这么多钱,接下来做什么?

上述的成绩单和独特性,或许成为了智谱一路备受看好、脱颖而出的关键原因。


但因为备受看好,积累了足够资本的智谱也表明了构建更长远竞争力的决心。


在10个月内狂揽25亿人民币融资后,智谱AI官方表态:


上述融资将用于基座大模型的进一步研发,更好地支撑行业生态,与合作伙伴一同高速发展。


核心归结起来就两大方面:


一是做大做强做坚实大模型底座。

二是拓展生态和朋友圈。


既要有深度,也要有广度。


首先,做大做强大模型底座,“进一步研发”基座大模型。


目前智谱视为底座的大模型,是发布于2021年的双语双向稠密模型GLM-130B,拥有1300亿参数。


当时受技术、数据、算力等诸多限制,训练这个参数量的大模型足够令人头秃,但成果很显著,GLM-130B的部分表现优于GPT-3以及PaLM。


不过时至今日,数据、模态增长带来的需求,昔年1300亿参数的庞然大物好像有些不够看了。


量子位得到的最新消息是,这周五(10月27日),智谱将有新动作——发布新一代基座大模型。



其次,拓展生态和朋友圈。


落实到具体行动上,应该绕不开智谱一以贯之的准则:持续开源。


这家公司一直是大模型领域最开放的玩家之一,早在前ChatGPT时代,它就和百度(ERNIE2.0)、阿里(AliceMind)、智源(清源CPM)、澜舟(孟子大模型)等一起,走透明、开放的态度。


现在翻看智谱早期的GLM报告,里面就有“我们邀请大家加入它的开放社区,推动大规模预训练模型的发展”的字样。现在,这家公司仍在用开源的方式,和开发者、行业用户交个朋友。

这个习惯延续到现在。


结合目前的数据,可以更清楚地看待智谱对开源的坚持,收获了什么阶段性结果:


开发者社区,ChatGLM-6B上线四周后抱抱脸趋势榜第一,累计超1000万下载,GitHub揽星5w+。


另一边,智谱公司官网上罗列着共建生态的合作伙伴,“69个国家,1000+个研究机构”。此外,量子位得到求证,其客户数量超过1000家,共建开源生态的在200-300家之间。




大模型生态一旦建立,就能更好地整合大模型基础层、中间层和应用层的资资源,进行优化配置,达到健康交互、协同进化的效果。


在这之中,基座大模型凭借基础性、通用性,位列大模型生态的核心地位。想明白这一点,就不难理解智谱致力于拓展生态和朋友圈的优势和必要性了。


大模型创业,步入分水岭时刻


去年十一月底,OpenAI给世界送来了ChatGPT。紧接着,大模型技术趋势以前所未有的速度掀起一波又一波的高潮。


直观数据是惊人的,呈现速度也是惊人的。


上亿的用户活跃度、十数亿的收入、百亿的估值……大模型不讲武德地强势席卷世界,所有人都在观望、探索,思考这个人工智能技术能够探索多广阔的边界,其支撑的产品又能如何发挥技术之力?


于是,国外有OpenAI、Anthropic这样的先驱者,国内也有了智谱AI、MiniMax这类百亿独角兽。


珠玉在前,技术和工程方面的部分问题无法快进和跳过,再明星的阵容、再天文数字的融资,只要走大模型的路,就必须亲自经历。


挑战十分严峻,但挑战者前赴后继,乐在其中。



今时今日,几乎一年过去,我们见证了大模型技术的发展,也见证了创新和竞争如何塑造着这个领域。


更可以清晰看到的是,巨头完成初步卡位,创业公司开始洗牌,第一阶段格局初现。


没错,一家公司做不完大模型能力内的所有事,但通用大模型的门票就这么有限,没有能力拿到的玩家,开始分流:要么走向专用,做行业模型;要么放弃模型层创业,开始站在别家模型的肩膀上,走向中间层、应用层……


大模型创业,正在进入分水岭时刻。



从今往后,关于大模型创业的融资进展,很可能比起现在会越来越聚集。动辄数亿数十亿的资金将继续聚集到“已经不差钱”公司。


行业的马太效应正在加剧。资本总量有限,越有价值的公司会被更加好看,最好最多的资源被送到最有潜力的那匹马手中。


资本市场上,贵的公司唯一的缺点就是贵,便宜的公司唯一的优点就是便宜。


大模型创业的上半场,即将结束。




文章来自微信公众号 “量子位”,作者 衡宇





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md