Adam有了mini版:内存占用少一半,吞吐量提升50% Adam有了mini版:内存占用少一半,吞吐量提升50% 关键词: Adam,AI,模型训练,AI训练 在训练大型语言模型(LLM)时,Adam(W) 基本上已经成为了人们默认使用的优化器。 来自主题: AI技术研报 8280 点击 2024-07-06 19:01