AI资讯新闻榜单内容搜索-Attention

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Attention

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Attention is all you need.

来自主题: AI技术研报

10746 点击 2024-08-22 16:44

这个大模型，真的治好了我的论文阅读障碍

这个大模型，真的治好了我的论文阅读障碍

这个大模型，真的治好了我的论文阅读障碍

今年 3 月份，英伟达 CEO 黄仁勋举办了一个非常特别的活动。他邀请开创性论文《Attention Is All You Need》的作者们齐聚 GTC，畅谈生成式 AI 的未来发展方向。

来自主题: AI资讯

7425 点击 2024-08-12 17:24

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。该论文的引用数已经将近 13 万，后来的 GPT 家族所有模型也都是基于 Transformer 架构，可见其影响之广。作为一种神经网络架构，Transformer 在从文本到视觉的多样任务中广受欢迎，尤其是在当前火热的 AI 聊天机器人领域。

来自主题: AI资讯

7656 点击 2024-08-11 17:38

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

用 FlexAttention 尝试一种新的注意力模式。

来自主题: AI资讯

9080 点击 2024-08-10 18:05

八问八答搞懂Transformer内部运作原理

八问八答搞懂Transformer内部运作原理

八问八答搞懂Transformer内部运作原理

七年前，论文《Attention is all you need》提出了 transformer 架构，颠覆了整个深度学习领域。

来自主题: AI技术研报

9731 点击 2024-08-07 14:31

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

740 TFLOPS！迄今最强 FlashAttention 来了。

来自主题: AI技术研报

9861 点击 2024-07-12 17:45

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

时隔一年，FlashAttention又推出了第三代更新，专门针对H100 GPU的新特性进行优化，在之前的基础上又实现了1.5～2倍的速度提升。

来自主题: AI技术研报

9895 点击 2024-07-12 16:57

H100利用率飙升至75%！英伟达亲自下场FlashAttention三代升级，比标准注意力快16倍

H100利用率飙升至75%！英伟达亲自下场FlashAttention三代升级，比标准注意力快16倍

H100利用率飙升至75%！英伟达亲自下场FlashAttention三代升级，比标准注意力快16倍

大模型训练推理神作，又更新了！

来自主题: AI资讯

9986 点击 2024-07-12 15:39

AI首次实时生成视频！尤洋团队新作，网友：这是新纪元

AI首次实时生成视频！尤洋团队新作，网友：这是新纪元

AI首次实时生成视频！尤洋团队新作，网友：这是新纪元

尤洋团队新作，首个基于DiT的实时视频生成方法来了！

来自主题: AI技术研报

9994 点击 2024-06-28 23:56

斯坦福让“GPU高速运转”的新工具火了，比FlashAttention2更快

斯坦福让“GPU高速运转”的新工具火了，比FlashAttention2更快

斯坦福让“GPU高速运转”的新工具火了，比FlashAttention2更快

AI算力资源越发紧张的当下，斯坦福新研究将GPU运行效率再提升一波——

来自主题: AI技术研报

11169 点击 2024-06-06 18:02

上一页当前第6页,共7页下一页