AI资讯新闻榜单内容搜索-分层索引稀疏注意力

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 分层索引稀疏注意力

北大团队改造DeepSeek注意力，速度快四倍还不丢精度

就在大家都急头白脸地等待DeepSeek-V4的时候，冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA（分层索引稀疏注意力），突破64K上下文的索引瓶颈，相比DeepSeek正在用的DSA（DeepSeek Sparse Attention）提速2-4倍。

来自主题: AI技术研报

7713 点击 2026-04-07 10:30