AI资讯新闻榜单内容搜索-DAM

全球第一AI科学家天团，首战封神！2.5个月找到治盲新药，医学圈震撼

就在刚刚，世界首个AI科学家天团首个成果重磅发布——治疗失明的新药被发现了，而且仅仅用时2.5个月！

来自主题: AI技术研报

8727 点击 2025-05-25 15:29

AI十周找到不治之症潜在新疗法，核心流程完全自主驱动

多智能体系统成功锁定

来自主题: AI技术研报

9573 点击 2025-05-23 12:45

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

视觉AI终极突破来了！英伟达等机构推出超强多模态模型DAM，仅3B参数，就能精准描述图像和视频中的任何细节。刚刚，英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model（DAM），仅3B参数。

来自主题: AI资讯

10323 点击 2025-04-27 10:47

Adam获时间检验奖！清华揭示保辛动力学本质，提出全新RAD优化器

Adam优化器是深度学习中常用的优化算法，但其性能背后的理论解释一直不完善。近日，来自清华大学的团队提出了RAD优化器，扩展了Adam的理论基础，提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。

来自主题: AI技术研报

8809 点击 2025-04-23 14:09

刚刚，ICLR 2025时间检验奖颁给Adam之父！Bengio「注意力机制」摘亚军

ICLR 2025时间检验奖重磅揭晓！Yoshua Bengio与华人科学家Jimmy Ba分别领衔的两篇十年前论文摘得冠军与亚军。一个是Adam优化器，另一个注意力机制，彻底重塑深度学习的未来。

来自主题: AI资讯

7970 点击 2025-04-15 17:06

月之暗面开源改进版Muon优化器，算力需求比AdamW锐减48%，DeepSeek也适用

算力需求比AdamW直降48%，OpenAI技术人员提出的训练优化算法Muon，被月之暗面团队又推进了一步！

来自主题: AI技术研报

10485 点击 2025-02-24 10:24

Adam有了mini版：内存占用少一半，吞吐量提升50%

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

9103 点击 2024-07-06 19:01

ICML 2024高分论文 | 零阶优化器微调大模型，大幅降低内存

开源大语言模型（LLM）百花齐放，为了让它们适应各种下游任务，微调（fine-tuning）是最广泛采用的基本方法。基于自动微分技术（auto-differentiation）的一阶优化器（SGD、Adam 等）虽然在模型微调中占据主流，然而在模型越来越大的今天，却带来越来越大的显存压力。

来自主题: AI技术研报

10692 点击 2024-07-04 13:35

腾讯混元、北大发现Scaling law「浪涌现象」，解决学习率调参难题

过去十年间，基于随机梯度下降（SGD）的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中，Adam 及其变种最受追捧。无论是 SGD，还是 Adam，亦或是其他优化器，最核心的超参数非 Learning rate 莫属。因此如何调整好 Leanring rate 是炼丹师们从一开始就必学的技能。

来自主题: AI技术研报

8139 点击 2024-06-05 22:57

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

近日，美国一家 web3 开发公司的创始工程师之一 Adam Majmudar 分享了他「手搓 GPU」成功的经历，引发了网友们的一大片点赞。令人惊讶的是，他仅用两周时间就完成了这一脑力壮举。在 Twitter/X 的主题帖子中，Majmudar 进行了直播，一步步带我们回顾了整个过程。

来自主题: AI资讯

7626 点击 2024-05-12 15:35