ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布
6735点击    2024-08-05 15:25

Llama 3.1刚发布不久,Llama 4已完全投入训练中。


这几天,小扎在二季度财报会上称,Meta将用Llama 3的十倍计算量,训练下一代多模态Llama 4,预计在2025年发布。


这笔账单,老黄又成为最大赢家

十倍计算量,是什么概念?

要知道,Llama 3是在两个拥有24,000块GPU集群完成训练。也就是说,Llama 4训练要用24万块GPU。




那么,Meta存货还够不够?


还记得小扎曾在年初宣布,计划到年底要部署35万块英伟达H100。


他还透露了更多的细节,Meta内部将为训练LLM打造两个单集群,一个配备22,000块H100,另一个集群配备24,000块。



有网友曾回顾了Llama模型迭代过程中,GPU的用量如何增长的:


Llama 1:2048块GPU


Llama 2:4096块GPU


Llama 3.1:16384块GPU



或斥资400亿美金,小扎不愿为时已晚


可见,训练大模型是一项代价高昂的业务。


财报显示,Meta第二季度在服务器、数据中心和网络基础设施上,资本支出增长了近33%。


从去年同期64亿美元,增至85亿美元。


现在,预计年度支出将达到370亿-400亿美元,高于之前预估的350亿-400亿美元。



Information一份报告称,OpenAI在训练模型上花费了30亿美元,另外还花费了40亿美元以折扣价从微软那里租用服务器。


可见,训练大模型算力花费,是多么地讽刺。


不过意义在于,Llama 3.1的开源将成为AI行业的一个重要转折点,开源人工智能开始像Linux一样成为行业标准。


Meta正在规划未来几年的计算集群和数据中心,以支持未来几代AI模型。


小扎承认,很难去预测未来AI技术的发展路径,但基建不是速成的。


尽管存在不确定性,我愿意冒险提前建立,也不愿意因准备不足而落后于竞争对手。



小扎这种先见之明,曾带领公司在元宇宙浪潮中,坚挺而出。


在2022年公司股价遭遇重创之际,小扎还是铤而走险,购买了大批H100。


当年第三季度财报显示,Meta资本支出高达320亿-330亿美元。


其中一部分大多流向数据中心、服务器和网络基础设施构建,以及在元宇宙上的巨额投入。



在采访中,小扎解释道,「当时Meta正大力发展短视频工具Reels,因此需要更多的GPU来训模型」。


因为模型推理对Meta来说,是至关重要的一件大事,需要为Facebook、Ins等自家应用的用户提供服务。


用小扎的原话来说就是:


我们所需的推理计算与训练的比率,可能远高于其他从事这一领域的公司,这是因为我们所服务的社区用户量非常庞大。


人手一个AI智能体


前段时间Meta AI科学家Thomas Scialom在一次博客采访中,同样提到了,6月份已经开始训练的Llama 4。


他表示,新模型可能重点在智能体技术上,并且已经在Toolformer等agent工具上进行了一些研究。


小扎相信,AI智能体很快将成为在线企业的「标配」。


「随着时间的推移,我认为,就像每个企业都有网站、社交媒体账号和电子邮件地址一样,未来每个企业也都会有一个AI智能体,让客户可以与之互动」。


Meta的目标是,让使每个小企业,最终甚至每个大企业,都能轻松地将自身的内容和产品整合到AI智能体中。


当这项技术大规模投入到现实应用中,这将大大加速我们的商业信息收入。

尽管投资者对Meta在AI和元宇宙上的高额支出提出批评,但小扎仍旧坚持自己的战略。


虽然在Meta最近几个季度,虚拟现实似乎已经退居次要地位,但扎克伯格确实提到,Quest 3的销量超出了公司的预期。


二季度数显示,这一领域的收入增长22%至391亿美元,利润增加73%至135亿美元。


对于第三季度,Meta预计收入在385-410亿美元之间。


消息人士表示,该公司将在9月份的Connect大会上宣布推出一款更便宜的耳机。


此外,AI助手Meta AI越来越受欢迎,小扎表示,它有望在年底前成为使用最广泛的AI助手。




文章来源微信公众号“新智元”



关键词: Llama 4 , GPU , meta AI , 模型训练
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md