AI资讯新闻榜单内容搜索-注意力机制

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 注意力机制

刚刚，谷歌AI路线图曝光：竟要抛弃注意力机制？Transformer有致命缺陷！

刚刚，谷歌AI路线图曝光：竟要抛弃注意力机制？Transformer有致命缺陷！

刚刚，谷歌AI路线图曝光：竟要抛弃注意力机制？Transformer有致命缺陷！

未来AI路线图曝光！谷歌发明了Transformer，但在路线图中承认：现有注意力机制无法实现「无限上下文」，这意味着下一代AI架构，必须「从头重写」。Transformer的时代，真的要终结了吗？在未来，谷歌到底有何打算？

来自主题: AI资讯

9936 点击 2025-06-17 11:06

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型，MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势，这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报

7724 点击 2025-06-16 15:24

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

视觉注意力机制，又有新突破，来自香港大学和英伟达。

来自主题: AI技术研报

8410 点击 2025-06-11 14:34

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

在大语言模型蓬勃发展的背景下，Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题，成为众多研究试图突破的重点

来自主题: AI技术研报

8140 点击 2025-06-11 11:43

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

注意力机制的「平方枷锁」，再次被撬开！一招Fenwick树分段，用掩码矩阵，让注意力焕发对数级效率。更厉害的是，它无缝对接线性注意力家族，Mamba-2、DeltaNet 全员提速，跑分全面开花。长序列处理迈入log时代！

来自主题: AI技术研报

8465 点击 2025-06-08 15:27

Mamba核心作者新作：取代DeepSeek在用的注意力机制，专为推理打造

Mamba核心作者新作：取代DeepSeek在用的注意力机制，专为推理打造

Mamba核心作者新作：取代DeepSeek在用的注意力机制，专为推理打造

曾撼动Transformer统治地位的Mamba作者之一Tri Dao，刚刚带来新作——提出两种专为推理“量身定制”的注意力机制。

来自主题: AI技术研报

7883 点击 2025-06-02 15:04

CVPR 2025 Highlight | 提升自回归模型样例学习能力，Few-shot图像编辑新范式开源

CVPR 2025 Highlight | 提升自回归模型样例学习能力，Few-shot图像编辑新范式开源

CVPR 2025 Highlight | 提升自回归模型样例学习能力，Few-shot图像编辑新范式开源

研究者针对 few-shot 图像编辑提出一个新的自回归模型结构 ——InstaManip，并创新性地提出分组自注意力机制（group self-attention），在此任务上取得了优异的效果。

来自主题: AI技术研报

8994 点击 2025-06-01 13:30

北大DeepSeek论文或预定ACL Best Paper！梁文锋署名

北大DeepSeek论文或预定ACL Best Paper！梁文锋署名

北大DeepSeek论文或预定ACL Best Paper！梁文锋署名

北大DeepSeek联合发布的NSA论文，目前已被ACL 2025录用并获得了极高评分，甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制，实现算力效率飞跃，被誉为长文本处理的革命性突破。

来自主题: AI资讯

9172 点击 2025-05-19 17:19

AI怎样模仿人类大脑的注意力机制？

AI怎样模仿人类大脑的注意力机制？

AI怎样模仿人类大脑的注意力机制？

最近，人们对AI谈得最多的是deepseek（简称DS）。这匹来自中国本土的黑马，闯入全球视野，一度扰乱美国股市，在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报

9330 点击 2025-05-17 18:15

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

和人工标记数据说拜拜，利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据！

来自主题: AI技术研报

6954 点击 2025-05-16 10:07

上一页当前第2页,共6页下一页