AI资讯新闻榜单内容搜索-grokking

AGI前夜重磅：RL突破模型「认知上限」，真·学习发生了！

UC Berkeley、UW、AI2 等机构联合团队最新工作提出：在恰当的训练范式下，强化学习（RL）不仅能「打磨」已有能力，更能逼出「全新算法」级的推理模式。他们构建了一个专门验证这一命题的测试框架 DELTA，并观察到从「零奖励」到接近100%突破式跃迁的「RL grokking」现象。

来自主题: AI技术研报

9143 点击 2025-10-22 11:33

早在 2021 年，研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象，模型在早期训练阶段对训练数据的记忆能力较弱，但随着持续训练，在某一个时间点，会突然从记忆转向强泛化。

来自主题: AI技术研报

10093 点击 2025-10-07 22:06

今天分享一篇符尧大佬的一篇数据工程（Data Engineering）的文章，解释了speed of grokking指标是什么，分析了数据工程

来自主题: AI资讯

10256 点击 2024-01-02 11:13

过度训练让中度模型出现了结构泛化能力。

来自主题: AI资讯

8128 点击 2023-12-08 14:37