又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点! 关键词: AI,端到端,SageAttention,模型训练 又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点! 来自主题: AI技术研报 7925 点击 2024-10-19 14:15