AI TNT— 让一部分先用AI实现商业化

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

740 TFLOPS！迄今最强 FlashAttention 来了。

来自主题: AI技术研报

7852 点击 2024-07-12 17:45

单卡A100实现百万token推理，速度快10倍，这是微软官方的大模型推理加速

微软的这项研究让开发者可以在单卡机器上以 10 倍的速度处理超过 1M 的输入文本。

来自主题: AI技术研报

5710 点击 2024-07-09 17:24

全美TOP 5机器学习博士：痛心，实验室H100数量为0！同实验室博士用GPU得靠抢

全美TOP 5的机器学习博士痛心发帖自曝，自己实验室里H100数目是0！这也引起了ML社区的全球网友大讨论。显然，相比普林斯顿、哈佛这样动辄三四百块H100的GPU大户，更常见的是GPU短缺的「穷人」。同一个实验室的博士，甚至时常会出现需要争抢GPU的情况。

来自主题: AI资讯

3712 点击 2024-06-29 18:21

「地表最快」 AI 芯片发布，哈佛辍学的本科生挑战英伟达

在谈到 AI、大模型、算力等关键词时，如果要提及硬件产品，很多人应该会不假思索的说出英伟达。

来自主题: AI资讯

6424 点击 2024-06-29 17:22

真的有人能在推理环节替代英伟达吗？

在中文互联网上，英伟达每天都在被颠覆。绝大部分自媒体和短视频达人都讨厌英伟达，包括周鸿祎在内。他们千方百计地指出，某种替代品（不管是不是国产）的性能指标已经超过英伟达A100或H100，后者即将沦为资本市场历史上最大的泡沫云云。尤其是在B站、小红书这样的平台，“英伟达将迅速被替代”可以被视为一致观点，反对这个观点的人将遭到群嘲。

来自主题: AI资讯

8046 点击 2024-06-29 13:47