ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
创业180天估值20亿美元!欧版OpenAI爆火,Llama主创自立门户,英伟达都入股了
5798点击    2023-12-05 16:39

“欧洲版OpenAI”最新估值,逼近20亿美元


总部位于巴黎的大模型初创公司Mistral AI最新一轮融资,4.87亿美元



投资方为安德森·霍洛维茨、英伟达、Salesforce等。


其中安德森·霍洛维茨领投约2亿欧元,英伟达、Salesforce计划通过转换债券再投资1.2亿欧元。


据了解,Mistral AI由前DeepMind、前Meta科学家创立。2位主创是Llama的核心贡献者


今年5月,他们出走后创业,迅速引发圈内关注。种子轮即获得1.13亿美元,公司估值达2.6亿美元。


9月时发布开源大模型Mistral-7B,全面对标Llama2。


如今,随着最新一轮融资进入最后阶段,意味着Mistral AI只用6个月时间,成功跻身独角兽行列。


据介绍,新资金将用于扩建团队、加速研发。


Llama主创出走创立


Mistral AI成立于今年5月,总部位于巴黎,公司使命为“构建能解决现实世界问题的下一代人工智能系统”。


由于有着宏大的AI愿景、主创均为AI领域顶尖人才、且快速发布自研大模型,Mistral AI被业界视为“欧洲版OpenAI”。


公司的3位主创分别是:


  • CEO:阿瑟•门奇(Arthur Mensch)


  • 首席科学家:纪尧姆•兰普尔(Guillaume Lample)


  • CTO:蒂莫西•拉克鲁瓦(Timothée Lacroix)



其中首席科学家和CTO,均是Llama的核心主创



首席科学家纪尧姆•兰普尔曾是Meta AI的研究科学家,领导了Llama的开发。


他博士毕业于卡内基梅隆大学、师从Chris Dyer,研究领域为NLP、机器学习等。



谷歌学术显示,兰普尔论文被引次数达1.9万次+。



CTO蒂莫西•拉克鲁瓦曾在Meta AI任职8年,还是PyTorch-BigGraph的主要贡献者。


CEO阿瑟•门奇今年30岁,创业前为DeepMind巴黎分部的研究员,2023年辞职后开始创业。


在DeepMind工作期间,门奇是Retro、Flamingo、Chinchilla等项目的主要贡献者,积累了丰富的大语言模型开发优化经验。



据了解,主创3人相识于学校时期,当时他们都在AI领域学习,CEO门奇表示他们是在2022年时开始讨论AI创业的想法。


今年6月,Mistral AI在成立仅4周后,即拿下1.13亿美元种子轮,由顶尖风投Lightspeed领投,估值达到2.6亿美元。


当时团队表示,他们将致力于大模型开源工作


9月,Mistral AI正式发布并开源了自家首个大模型Mistral-7B,并且全面对标Llama2。


据论文介绍,Mistral-7B在所有基准测试中超越了Llama 2(13B),并在推理、数学、代码生成任务中超越了Llama 2(34B)。


Mistral-7B采用了Llama2中同样的分组查询注意力机制,能加速推理;结合滑动窗口注意力机制,可以有效处理任意长度序列,降低推理成本。


同时他们还提供了一个微调模型Mistral 7B – Instruct,也超越了Llama2(13B)聊天模型在人类和自动化基准测试中的表现。




Mistral-7B表明,LLM的知识压缩能力或许超过我们此前预期。想要用小模型获得更好性能,还有非常多探索空间。


据了解,为避免版权问题,Mistral使用公开数据训练大模型。


成为欧洲AI新星


随着自家大模型的发布,Mistral也正式与OpenAI、谷歌等展开较量。


CEO门奇曾在采访中表示,尽管公司很年轻、团队规模不大,但是“我们与所有人竞争”。



而由于集结了大模型领域多位顶尖人才,Mistral从成立之初就备受业内关注,尤其是欧洲方面。


其种子轮吸引了诸多欧洲老牌风投,比如法国的Redpoint、Index Ventures等,德国的La Famiglia和Headline,以及意大利、比利时、英国风投也参与其中。


前不久在伦敦举行的首届人工智能安全峰会,Mistral作为唯一一家欧洲公司,和科技巨头们共同出席了第二天的小型会议。


而且,Mistral也确实没让投资方失望。


据说其首款大模型发布本来预计在年底面世,结果一下提前3个月,在9月就发布了。


有顶尖团队阵容、又手握自研大模型,也就不难理解Mistral的估值快速增长了。


最新一轮融资更是主要由硅谷贡献。


新资金将用于扩大团队规模、加快研发,并在欧洲和美国建立新的办公室。


据介绍,作为交易的一部分,Mistral的三位联合创始人将各自出售超过100万英镑的股权。


而这轮巨大融资也再次印证,投资者正在争相寻找“下一个OpenAI”,诸多大型投资方都愿意在创企早期以高价购入股份,这也是创业公司在早期估值飙升的原因之一。


参考链接:


[1]https://www.businessinsider.com/mistral-in-talks-to-raise-funding-at-2-billion-valuation-2023-11


[2]https://techstartups.com/2023/12/04/openai-rival-mistral-ai-nears-2-billion-valuation-with-backing-from-andreessen-horowitz-nvidia-and-salesforce/


[3]https://www.ft.com/content/387eeeab-1f95-4e3b-9217-6f69aeeb5399


文章来自于微信公众号‘‘量子位’’ QbitAI,作者 “明敏”
关键词: Mistral AI , AI大模型 , Llama
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner