AI资讯新闻榜单内容搜索-LLaMA

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

每3个小时1次、平均1天8次，Llama 3.1 405B预训练老出故障，H100是罪魁祸首？

来自主题: AI资讯

11804 点击 2024-07-29 19:52

不是大模型用不起，而是小模型更有性价比。

来自主题: AI资讯

6620 点击 2024-07-29 17:42

Meta 发布 Llama 3.1 405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 AI 即未来」，再次将开源与封闭的争论推向舞台中央。

来自主题: AI技术研报

8568 点击 2024-07-28 23:19

最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。

来自主题: AI技术研报

10105 点击 2024-07-28 22:00

最近两款大型 AI 模型相继发布。

来自主题: AI技术研报

9598 点击 2024-07-27 20:08

芯片巨头英伟达，在AI时代一直被类比为在淘金热中“卖铲子”的背后赢家。

来自主题: AI资讯

9534 点击 2024-07-27 19:59

用来运行 Llama 3 405B 优势明显。

来自主题: AI技术研报

10487 点击 2024-07-27 19:22

Llama 3.1 405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。

来自主题: AI资讯

5782 点击 2024-07-26 17:20

继分不清9.11和9.9哪个大以后，大模型又“集体失智”了！

来自主题: AI资讯

11794 点击 2024-07-25 22:16

紧跟着Meta的重磅发布，Mistral Large 2也带着权重一起上新了，而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学和多语言等专业领域可与SOTA模型直接竞争，还支持单节点部署。

来自主题: AI资讯

10578 点击 2024-07-25 21:50