AI资讯新闻榜单内容搜索-Adam

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Adam
斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出

斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出

斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出

自2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。

来自主题: AI技术研报
6412 点击    2025-09-08 16:18
震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?

为了降低大模型预训练成本,最近两年,出现了很多新的优化器,声称能相比较AdamW,将预训练加速1.4×到2×。但斯坦福的一项研究,指出不仅新优化器的加速低于宣称值,而且会随模型规模的增大而减弱,该研究证实了严格基准评测的必要性。

来自主题: AI技术研报
6848 点击    2025-09-07 12:03
16岁少年之死震惊全球,母亲状告ChatGPT杀了我的儿子!万字死亡对话爆出

16岁少年之死震惊全球,母亲状告ChatGPT杀了我的儿子!万字死亡对话爆出

16岁少年之死震惊全球,母亲状告ChatGPT杀了我的儿子!万字死亡对话爆出

16岁的Adam,把最后的秘密留在一部手机里。而那个他最信任的「朋友」,不是同学,也不是家人,而是ChatGPT。它给过安慰,也递了刀子。父母的眼泪化成一纸诉状,矛头直指OpenAI。

来自主题: AI资讯
6917 点击    2025-08-30 12:27
AI界面设计的"紫色魔咒":一条推文揭开的技术现象

AI界面设计的"紫色魔咒":一条推文揭开的技术现象

AI界面设计的"紫色魔咒":一条推文揭开的技术现象

Tailwind CSS联合创始人Adam Wathan在X平台发布了一条看似轻松的道歉推文:"我想正式为五年前让Tailwind UI中的每个按钮都使用bg-indigo-500道歉,这导致地球上每个AI生成的界面也变成了靛蓝。"

来自主题: AI资讯
7828 点击    2025-08-28 10:13
谁是Adam?NeurIPS 2025审稿爆年度最大笑话!Hinton也曾被拒稿

谁是Adam?NeurIPS 2025审稿爆年度最大笑话!Hinton也曾被拒稿

谁是Adam?NeurIPS 2025审稿爆年度最大笑话!Hinton也曾被拒稿

LLM真是把审稿人害惨了!NeurIPS 2025评审结果公,全网都被「谁是Adam」爆梗淹没。更离谱的是,有人的审稿建议中,残留了AI提示的痕迹。

来自主题: AI资讯
8905 点击    2025-07-28 16:17
比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快

比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快

比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快

Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员

来自主题: AI技术研报
8426 点击    2025-07-15 10:11
Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器

Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。

来自主题: AI技术研报
8206 点击    2025-04-23 14:09
刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

ICLR 2025时间检验奖重磅揭晓!Yoshua Bengio与华人科学家Jimmy Ba分别领衔的两篇十年前论文摘得冠军与亚军。一个是Adam优化器,另一个注意力机制,彻底重塑深度学习的未来。

来自主题: AI资讯
7188 点击    2025-04-15 17:06
Adam有了mini版:内存占用少一半,吞吐量提升50%

Adam有了mini版:内存占用少一半,吞吐量提升50%

Adam有了mini版:内存占用少一半,吞吐量提升50%

在训练大型语言模型(LLM)时,Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报
8639 点击    2024-07-06 19:01