AI资讯新闻榜单内容搜索-FP4

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

清华大学朱军教授团队提出SageAttention3，利用FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可行性，在微调中实现了无损性能。

来自主题: AI技术研报

6174 点击 2025-07-08 12:08

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加，注意力运算（Attention）的时间开销逐渐成为主要开销。

来自主题: AI技术研报

7283 点击 2025-06-19 10:47

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

7237 点击 2025-01-30 15:11

英伟达迷你超算遭友商嘲讽：宣传FP4算力，实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS，开启了AI超算的PC时刻。但随即也引发了不小争议，还遭到了大佬的贴脸嘲讽。

来自主题: AI资讯

7078 点击 2025-01-10 16:10

黄仁勋问答全文：关于中国市场、全球供应链、奥特曼和Groq

今年GTC大会上，英伟达推出了地表最强Blackwell计算平台、NIM推理微服务、Omniverse Cloud API等惊喜新品。其中Blackwell GPU具有2080亿个晶体管，AI算力直接暴涨30倍。单芯片训练性能（FP8）是Hopper架构的2.5 倍，推理性能（FP4）是Hopper架构的5倍。具有第5代NVLink互连，并且可扩展至576个GPU。

来自主题: AI资讯

5885 点击 2024-03-22 16:04