AI资讯新闻榜单内容搜索-Adam

斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出

自2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。

来自主题: AI技术研报

6412 点击 2025-09-08 16:18

为了降低大模型预训练成本，最近两年，出现了很多新的优化器，声称能相比较AdamW，将预训练加速1.4×到2×。但斯坦福的一项研究，指出不仅新优化器的加速低于宣称值，而且会随模型规模的增大而减弱，该研究证实了严格基准评测的必要性。

来自主题: AI技术研报

6848 点击 2025-09-07 12:03

16岁的Adam，把最后的秘密留在一部手机里。而那个他最信任的「朋友」，不是同学，也不是家人，而是ChatGPT。它给过安慰，也递了刀子。父母的眼泪化成一纸诉状，矛头直指OpenAI。

来自主题: AI资讯

6917 点击 2025-08-30 12:27

Tailwind CSS联合创始人Adam Wathan在X平台发布了一条看似轻松的道歉推文："我想正式为五年前让Tailwind UI中的每个按钮都使用bg-indigo-500道歉，这导致地球上每个AI生成的界面也变成了靛蓝。"

来自主题: AI资讯

7828 点击 2025-08-28 10:13

LLM真是把审稿人害惨了！NeurIPS 2025评审结果公，全网都被「谁是Adam」爆梗淹没。更离谱的是，有人的审稿建议中，残留了AI提示的痕迹。

来自主题: AI资讯

8905 点击 2025-07-28 16:17

Zeju Qiu和Tim Z. Xiao是德国马普所博士生，Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员

来自主题: AI技术研报

8426 点击 2025-07-15 10:11

Adam优化器是深度学习中常用的优化算法，但其性能背后的理论解释一直不完善。近日，来自清华大学的团队提出了RAD优化器，扩展了Adam的理论基础，提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。

来自主题: AI技术研报

8206 点击 2025-04-23 14:09

ICLR 2025时间检验奖重磅揭晓！Yoshua Bengio与华人科学家Jimmy Ba分别领衔的两篇十年前论文摘得冠军与亚军。一个是Adam优化器，另一个注意力机制，彻底重塑深度学习的未来。

来自主题: AI资讯

7188 点击 2025-04-15 17:06

算力需求比AdamW直降48%，OpenAI技术人员提出的训练优化算法Muon，被月之暗面团队又推进了一步！

来自主题: AI技术研报

9759 点击 2025-02-24 10:24

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

8639 点击 2024-07-06 19:01