AI资讯新闻榜单内容搜索-H100

GPU 维修那些事： H100 哪里容易坏？以 Llama3 训练大模型为例

根据去年2024年7月28日Meta公司在训练大模型（Llama 3）时使用“16384 个英伟达H100 GPU 集群”的经验，该显卡在高负载、大规模集群运行环境下容易出现以下故障点：

来自主题: AI技术研报

10568 点击 2025-04-07 09:17

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

原生多模态Llama 4终于问世，开源王座一夜易主！首批共有两款模型Scout和Maverick，前者业界首款支持1000万上下文单H100可跑，后者更是一举击败了DeepSeek V3。目前，2万亿参数巨兽还在训练中。

来自主题: AI技术研报

9087 点击 2025-04-06 18:06

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

AI不过周末，硅谷也是如此。大周日的，Llama家族上新，一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列，目前共有三个款：Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

来自主题: AI资讯

9773 点击 2025-04-06 12:15

GPU维修：技术外衣下的暴利产业链，一鱼三吃？！

在算力投资激增的当下，GPU卡回收与维修行业逐渐成为一条隐秘的暴利赛道。特别是一些众所周知的原因，串串资源的货源和魔改卡的维保是重灾区！现状：运营一年以上的算力中心运营商手里一定有坏掉的A100和H100服务得不到及时维修，放在那吃灰，无法对外出租算力产生收入。

来自主题: AI资讯

10312 点击 2025-04-02 15:01

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一个高效的蒸馏扩散模型，专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏（sCM）和潜空间对抗蒸馏（LADD）的混合蒸馏策略，SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像，在速度和质量的权衡方面树立了新的标杆。

来自主题: AI技术研报

9064 点击 2025-03-31 16:16