无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升 关键词: AI,模型训练,人工智能,MoA 随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 来自主题: AI技术研报 2742 点击 2024-11-08 19:19