ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率 关键词: LowMemoryBP,反向传播,模型训练,微调,AI 自从大型 Transformer 模型逐渐成为各个领域的统一架构,微调就成为了将预训练大模型应用到下游任务的重要手段 来自主题: AI技术研报 9093 点击 2024-07-12 17:47