多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA 关键词: Transformer,Mamba,AI框架,模型训练,SSMs Attention is all you need. 来自主题: AI技术研报 8771 点击 2024-08-22 16:44