AI资讯新闻榜单内容搜索-GPU

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

8951 点击 2024-08-12 13:50

有CPU就能跑大模型，性能甚至超过NPU/GPU！

来自主题: AI技术研报

10380 点击 2024-08-09 14:16

一场未完成的投资改变了什么？

来自主题: AI资讯

9793 点击 2024-08-09 09:54

AI重新定义游戏体验的时代。

来自主题: AI资讯

9410 点击 2024-08-08 11:27

a16z的氧气计划

来自主题: AI资讯

7514 点击 2024-08-07 11:27

谷歌TPU核心团队创立，要做世界最快推理。

来自主题: AI技术研报

10348 点击 2024-08-06 15:27

Groq又双叒给英伟达上压力了！不仅之前展现了每秒1256个token的破纪录输出速度，最新获得的一轮6.4亿美元融资更提供了在AI芯片领域挑战英伟达的底气。

来自主题: AI资讯

9175 点击 2024-08-06 14:46

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

7538 点击 2024-08-05 15:25

英伟达最强芯片B200被迫推迟三个月，传闻闹的沸沸扬扬。

来自主题: AI资讯

9398 点击 2024-08-05 14:28

因设计缺陷，英伟达最强AI芯片Blackwell，真的要延期发货了。金主爸爸们哀声一片，所有预定计划预计要拖延至少三个月。

来自主题: AI技术研报

10775 点击 2024-08-05 13:54