AI资讯新闻榜单内容搜索-H100

买不到GPU，马斯克自曝AI巨兽Dojo！自研超算挑战英伟达，约等于8千块H100

多年来，马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示，随着特斯拉准备在10月推出Robotaxi，AI团队将「加倍投入」Dojo。

来自主题: AI资讯

7459 点击 2024-08-04 14:53

缺卡、缺电、缺组网技术，谁能为马斯克构建出全球最强大的 10 万卡超级集群？

埃隆·马斯克掌控的那几家公司——包括SpaceX、特斯拉、xAI乃至X（原Twitter）——都需要大量的GPU，而且也都是为自己的特定AI或者高性能计算（HPC）项目服务。

来自主题: AI资讯

11716 点击 2024-08-01 12:03

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型如何压缩

面对LLM逐渐膨胀的参数规模，没有H100的开发者和研究人员们想出了很多弥补方法，「量化」技术就是其中的一种。这篇可视化指南用各种图解，将「量化」的基本概念和分支方法进行了全方位总结。

来自主题: AI技术研报

11010 点击 2024-07-31 16:21

1.6万块H100训Llama 3.1，每3小时故障1次！罪魁祸首竟是GPU和HBM3显存

在Meta的Llama 3.1训练过程中，其运行的1.6万个GPU训练集群每3小时就会出现一次故障，意外故障中的半数都是由英伟达H100 GPU和HBM3内存故障造成的。

来自主题: AI技术研报

11780 点击 2024-07-29 20:16

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

每3个小时1次、平均1天8次，Llama 3.1 405B预训练老出故障，H100是罪魁祸首？

来自主题: AI资讯

11797 点击 2024-07-29 19:52

最强开源大模型一夜封神，Llama 3.1震撼发布，真正的全民GPT-4时代来了

榨干16000块H100、基于15亿个Tokens训练。

来自主题: AI资讯

6454 点击 2024-07-25 10:32

马斯克狂揽10万块H100，自建世界最强AI超算，下一代模型训练开始

世界最强AI集群，马斯克建成了！这一爆炸消息，由老马在推特上亲自官宣。

来自主题: AI资讯

7869 点击 2024-07-24 10:13

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒

10万块液冷H100正式开工，马斯克19天建成世界最强AI训练集群。

来自主题: AI资讯

6223 点击 2024-07-23 16:03

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

不用H100，三台苹果电脑就能带动400B大模型。背后的功臣，是GitHub上的一个开源分布式AI推理框架，已经斩获了2.5k星标。

来自主题: AI技术研报

9544 点击 2024-07-23 00:26

中国公司豪掷900亿买英伟达阉割芯片，全靠华为顶不住

整个市场不再追求大而全，都在走小而精的路线了。

来自主题: AI资讯

7209 点击 2024-07-17 20:26

AI资讯新闻榜单内容搜索-H100

买不到GPU，马斯克自曝AI巨兽Dojo！自研超算挑战英伟达，约等于8千块H100

缺卡、缺电、缺组网技术，谁能为马斯克构建出全球最强大的 10 万卡超级集群？

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型如何压缩

1.6万块H100训Llama 3.1，每3小时故障1次！罪魁祸首竟是GPU和HBM3显存

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

最强开源大模型一夜封神，Llama 3.1震撼发布，真正的全民GPT-4时代来了

马斯克狂揽10万块H100，自建世界最强AI超算，下一代模型训练开始

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星​

中国公司豪掷900亿买英伟达阉割芯片，全靠华为顶不住

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星