AI资讯新闻榜单内容搜索-A100

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了！他给自己的最新挑战：复现OpenAI经典成果，从基础版GPT-2开始。

来自主题: AI技术研报

9660 点击 2024-05-30 10:30

FP8和更低的浮点数量化精度，不再是H100的“专利”了！

来自主题: AI技术研报

8321 点击 2024-04-29 20:17

【新智元导读】52B的生产级Mamba大模型来了！这个超强变体Jamba刚刚打破世界纪录，它能正面硬刚Transformer，256K超长上下文窗口，吞吐量提升3倍，权重免费下载。

来自主题: AI技术研报

7383 点击 2024-03-29 16:43

简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦，其团队在 ICCV 2021 会议上发表过一项类似的研究：仅仅使用一个或数个手绘草图，即可以自定义一个现成的 GAN 模型，进而输出与草图匹配的图像。

来自主题: AI资讯

7029 点击 2024-03-21 18:32

许久未更新大模型的英伟达推出了150亿参数的Nemotron-4，目标是打造一个能在单个A100/H100可跑的通用大模型。

来自主题: AI技术研报

6604 点击 2024-02-29 13:58

英伟达最新财报出炉。连创“三高”：

来自主题: AI资讯

6284 点击 2024-02-22 15:11

今年，会不会是AI视频生成模型的元年？UT Austin联手Meta团队提出了一个全新V2V模型FlowVid，能够在1.5分钟内生成4秒高度一致性的视频。

来自主题: AI资讯

5568 点击 2024-01-02 15:09

都快到年底了，大模型领域还在卷，今天，Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手，甚至还能和Llama 70B掰手腕！

来自主题: AI资讯

9301 点击 2023-12-13 15:41

没想到，在ChatGPT爆火后的一年里，竟然出现了一个隐藏“Boss”——量子位获悉，百度、360等互联网大厂均已开始基于昇腾部署AI模型；而知乎、新浪、美图这样全速推进AI业务的公司，背后同样出现了华为云昇腾AI云服务的身影。

来自主题: AI资讯

11172 点击 2023-12-08 14:45

大语言模型需要消耗巨量的GPU内存。有可能一个单卡GPU跑推理吗？可以的话，最低多少显存？70B大语言模型仅参数量就有130GB，仅仅把模型加载到GPU显卡里边就需要2台顶配100GB内存的A100。

来自主题: AI资讯

8900 点击 2023-12-07 11:00