Mistral AI盈利路径不明确,但其边缘AI模型性能超谷歌、Meta。
智东西10月18日消息,据The Information报道,The Information列出了78家可能成为收购目标的生成式AI初创企业AI独角兽,Mistral AI位列其中。
其分析Mistral AI有被收购风险的原因有两个:首先,Mistral AI的盈利路径尚不明确。尽管通过对其API收费获得了一些收入,但愿意为较大模型支付费用的用户比例不足10%。其次,Mistral AI拥有出色的边缘AI模型,新发模型可实现在端侧部署的可能性。10月16日,Mistral AI发布了边缘AI模型Ministraux系列,包含两个参数规模,分别是Ministral 3B和Ministral 8B。这些模型体积小到可以在端侧设备上运行,并且性能优于相近参数规模的谷歌Gemma 2系列和Meta的Llama 3.1、Llama 3.2系列模型。
但是,Mistral AI的潜在买家并不多,亚马逊、苹果等科技巨头对Mistral AI的收购意向尚不明确。高达60亿美元的估值会引发监管审查的大额许可费。此外,AI行业的大额交易还面临着监管机构的严格审查,这也限制了潜在买家的数量。
Mistral AI的创始人正在寻找其他方法来缓解困境。比如通过为企业开发使用其模型的AI应用来创造收入;寻求涉及更多融资、收入分成或联合研究的战略合作;带领团队和技术重新加入他们之前工作过的公司谷歌或Meta。
昨天,The Information列出了78家可能成为收购目标的生成式AI初创企业。这些公司要么自己开发模型或聊天机器人,要么至少两年没有获得融资,或者两者兼有。报告里提到,这些初创企业面临的困境在于:构建大语言模型和硬件的成本高昂,而客户对尚未验证投资回报的AI应用程序和工具持谨慎态度。在资金紧张的情况下,这些公司通常会对收购提议持开放态度。
在这份名单中,Mistral AI的出现令人意外。
Mistral AI是一家主攻开源模型的创企,其创始人有谷歌DeepMind和Meta背景。Mistral AI联合创始人兼CEO亚瑟·门施(Arthur Mensch)曾在谷歌工作,参与了Gemini和Flamingo(一个多模态模型)项目。Mistral AI联合创始人兼CTO蒂莫西·拉克鲁瓦(Timothée Lacroix)和首席科学家威廉·兰普尔(Guillaume Lample),均参与了Meta旗舰人工智能模型Llama的第一代开发。
Mistral AI有被收购风险的原因有两个:一是盈利路径不明确;二是边缘AI模型性能优秀,新发模型可实现在端侧部署的可能性。
1、总融资额12亿美元,主攻开源模型,付费用户不足10%
今年六月,Mistral AI筹集了6.4亿美元的新资金,总融资额达到12亿美元,这一数额超过了大多数AI初创企业。这笔资金使Mistral AI的估值达到了约60亿美元。
筹集了大量资金并不意味着被收购的可能性低。大语言模型初创企业Inflection筹集了16亿美元,但在公司用完这笔资金之前,已于三月被微软收购。
Mistral AI的盈利路径尚不明确,正是其可能被收购的原因之一。该公司采用开源方式开发AI模型,这意味着它不会通过出售这些模型的使用权来盈利。同时,它还要面对来自Meta等其他开源模型开发商的激烈竞争。
据The Information先前报道,Mistral AI通过对其API收费获得了一些收入。然而,在Mistral AI的合作伙伴中,愿意为其较大模型支付费用的用户比例不足10%。Mistral AI可能通过为企业开发使用其模型的AI应用来创造收入。这种策略类似于德国AI软件开发商Aleph Alpha的做法。Aleph Alpha在放缓与OpenAI的竞争后,也采用了类似的策略。不过,Mistral AI尚未明确表示它正在考虑这种业务模式。
另一个主要的开源AI开发商Meta通过数字广告业务获得了巨额收入,并且寄希望于其AI工具帮助广告主更高效地选择目标并优化投放,以此进一步改善其广告业务。尽管Meta在AI领域投资了数百亿美元,但如何从这些投资中获得回报尚不明确。
2、新发3B、8B端侧AI模型,性能超谷歌、Meta相近参数模型
10月16日,在Mistral 7B模型发布一周年之际,Mistral AI发布了边缘AI模型Ministraux系列,包含两个参数规模,分别是Ministral 3B和Ministral 8B。
这些模型在10B参数以下的模型中,在知识、常识、推理、函数调用和效率方面性能更好,可以被用到编排代理工作流程到创建专业任务工作中。
两种模型都支持高达128k的上下文长度,Ministral 8B还具有特殊的交错滑动窗口注意模式,可实现更快且节省内存的推理。
这个系列的模型可与Mistral Large等大语言模型结合使用。它们可以经过调整,以极低的延迟和成本、在多个上下文中根据用户意图处理输入解析、任务路由和调用API。新模型体积小到可以在手机等端侧设备上运行,而不需要在云端运行。
Mistral AI声称这些模型在某些基准测试中,性能表现优于相近参数规模的谷歌Gemma 2系列和Meta的Llama 3.1、Llama 3.2系列模型。两个模型相比更大的Mistral 7B模型性能也有所改进。
3B和8B新模型的性能表现以及Mistral AI其他模型的成功,可能为Mistral AI成为有力收购目标助力。
▲Ministral 3B和Gemma 2 2B, Llama 3.2 3B,Mistral 7B性能的比较。(图源:Mistral AI)
▲Ministral 8B和Gemma 2 9B, Llama 3.1 8B, Mistral 7B性能的比较。(图源:Mistral AI)
尽管Mistral AI拥有强大的技术和资金支持,但其高昂的估值可能会影响潜在买家的决策。Mistral AI的估值高达约60亿美元。相比之下,Inflection、Adept和Character.AI在达成被收购交易时的估值约为10亿美元。对于Mistral AI的潜在收购方而言,支付一个既能让股东满意又不至于引发监管审查的大额许可费可能是相当具有挑战性的。
据The Information报道,亚马逊、Meta、苹果、谷歌均是Mistral AI的潜在买家。
这几个买家的收购方式也各有不同。其中,亚马逊的收购方式可能是采用与创企达成许可和雇佣协议的策略,此前它已经与AI代理开发商Adept和机器人软件初创公司Covariant达成了许可和雇佣协议。
苹果已经展现出对多家创企的收购意向,苹果高管至少已经与三家AI初创公司会面讨论了可能的收购事宜,已经达成的一笔收购是在去年12月,据法国商业杂志Challenges报道,苹果在去年12月悄悄收购了专注于图像分析和边缘计算的AI初创公司Datakalab。
另一个潜在买家微软,虽然在2月对Mistral AI进行了投资,但据The Information报道,Mistral AI并不是微软收购的目标。
针对Mistral AI的收购事宜,亚马逊和Meta拒绝置评,苹果和谷歌未回应评论请求。
除了直接被收购外,Mistral AI还可能寻求一种涉及更多融资、收入分成或联合研究的战略合作。这种合作方式类似于大语言模型初创企业Cohere与云计算数据库公司Snowflake的合作,或是OpenAI与微软的合作。
在Cohere与Snowflake的合作中,Snowflake的用户可以使用Cohere模型支持的AI应用软件。在OpenAI与微软的合作中,微软对OpenAI进行了大量投资,并在技术和产品上展开了深度合作。
另一种可能是,Mistral AI的创始人可能会效仿AI聊天机器人公司Character.AI创始人的做法,带着团队和技术重新加入他们之前工作过的公司谷歌或Meta。Mistral AI可能会跟随Inflection的脚步投入微软的怀抱。
此外,任何涉及Mistral AI的交易都可能受到美国和欧盟监管机构的关注,尤其是考虑到它作为欧洲少数几家领先的AI初创企业的地位。
这可以从欧洲其他几家知名创企的最新动向中看出来。法国专注于前沿动作模型和任务自动化的公司H,该公司五位创始人中有三位已经离开。同时,德国的AI软件开发商Aleph Alpha也缩减了其业务野心。这两家公司的表现不佳引起了欧洲监管机构的担忧。在这种背景下,Mistral AI的发展备受监管机构和法国政府的关注。欧洲顶级反垄断监管机构在二月份表示,将会审查微软对Mistral AI的投资。
不过,还有其他观点表达了对Mistral AI独立发展的愿望。法国总统埃马纽埃尔·马克龙(Emmanuel Macron)在五月份接受CNBC采访时,也表达了希望Mistral AI保持独立发展的愿望。“我们是一家独立的公司,并打算继续保持独立发展。”Mistral AI的一位发言人曾对The Information透露。
亚马逊、苹果等科技巨头通过与AI创企并购或合作,获取了行业顶尖的技术和人才,从而在AI领域占据领先地位。这也为AI初创企业提供了一条可行的发展路径。
盈利困难是许多AI初创企业普遍面临的难题。高昂的研发成本和客户对未验证技术的谨慎态度,使得这些企业在探索可持续商业模式时步履维艰。
为了更好地发展,小型AI初创企业纷纷寻求被大型科技公司收购的机会,或者与其建立战略合作关系,以实现更多融资、收入分成或联合研究。此外,通过“模型授权协议+核心团队挖角”的方式,这些初创企业可以实现变相并购交易,确保持续的资金支持和技术发展。
文章来自于“智东西”,作者“汪越、程茜”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md