震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实? 震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实? 关键词: AI,模型训练,AI优化器,模型训练成本 为了降低大模型预训练成本,最近两年,出现了很多新的优化器,声称能相比较AdamW,将预训练加速1.4×到2×。但斯坦福的一项研究,指出不仅新优化器的加速低于宣称值,而且会随模型规模的增大而减弱,该研究证实了严格基准评测的必要性。 来自主题: AI技术研报 6723 点击 2025-09-07 12:03