AI资讯新闻榜单内容搜索-ICLR

Mamba-3惊现AI顶会ICLR 2026！CMU知名华人教授一作首代工作AI圈爆红

曼巴回来了！Transformer框架最有力挑战者之一Mamba的最新进化版本Mamba-3来了，已进入ICLR 2026盲审环节，超长文本处理和低延时是其相对Transformer的显著优势。另一个挑战者是FBAM，从不同的角度探索Transformer的下一代框架。

来自主题: AI资讯

10299 点击 2025-10-13 14:34

拒稿警告，靠大模型「偷摸水论文」被堵死，ICLR最严新规来了

刚刚，又一个人工智能国际顶会为大模型「上了枷锁」。 ICLR 2025 已于今年 4 月落下了帷幕，最终接收了 11565 份投稿，录用率为 32.08%。

来自主题: AI资讯

9077 点击 2025-08-27 17:30

简单即强大：全新生成模型「离散分布网络DDN」是如何做到原理简单，性质独特？

本项工作提出了一种全新的生成模型：离散分布网络（Discrete Distribution Networks），简称 DDN。相关论文已发表于 ICLR 2025。

来自主题: AI技术研报

8067 点击 2025-08-17 13:35

ICLR25|打开RL黑盒，首次证明强化学习存在内在维度瓶颈

一句话概括，原来强化学习的“捷径”是天生的，智能体能去的地方（流形）被动作维度（低维流形）限制得死死的，根本没机会去那些没用的高维空间瞎逛。

来自主题: AI资讯

7343 点击 2025-08-05 11:59

强化学习的两个「大坑」，终于被两篇ICLR论文给解决了

实时强化学习来了！AI 再也不怕「卡顿」。设想这样一个未来场景：多个厨师机器人正在协作制作煎蛋卷。

来自主题: AI技术研报

9862 点击 2025-07-18 14:06

Correlations：氛围测试你的向量模型

在今年 ICLR 会议上，我们被问到最多且最有意思的问题是：像 Jina AI 这样的向量搜索模型提供商，除了在 MTEB 上做基准测试，会不会做些氛围测试（Vibe-testing)？

来自主题: AI技术研报

10540 点击 2025-05-31 15:20

GPT-4o舔出事了！赛博舔狗背后，暗藏6大AI套路

上月，ChatGPT-4o无条件跪舔用户，被OpenAI紧急修复。然而，ICLR 2025的文章揭示LLM不止会「跪舔」，还有另外5种「套路」。

来自主题: AI技术研报

8457 点击 2025-05-23 15:46

谷歌DeepMind&CMU：过去引导LLM规划的方法是错的？用GRASE-DC改进。ICLR2025

当您的Agent需要规划多步骤操作以达成目标时，比如游戏策略制定或旅行安排优化等等，传统规划方法往往需要复杂的搜索算法和多轮提示，计算成本高昂且效率不佳。来自Google DeepMind和CMU的研究者提出了一个简单却非常烧脑的问题：我们是否一直在用错误的方式选择示例来引导LLM学习规划？

来自主题: AI技术研报

10923 点击 2025-05-09 11:58

ICLR 2025 | 无需训练加速20倍，清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

扩散模型（Diffusion Models）近年来在生成任务上取得了突破性的进展，不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现，推动了文本到图像、视频生成的技术革新。然而，标准扩散模型的设计通常只适用于从随机噪声生成数据的任务，对于图像翻译或图像修复这类明确给定输入和输出之间映射关系的任务并不适合。

来自主题: AI技术研报

9084 点击 2025-05-08 14:23

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

多模态大模型（MLLMs）在视觉理解与推理等领域取得了显著成就。然而，随着解码（decoding）阶段不断生成新的 token，推理过程的计算复杂度和 GPU 显存占用逐渐增加，这导致了多模态大模型推理效率的降低。

来自主题: AI技术研报

8142 点击 2025-04-29 14:56

AI资讯新闻榜单内容搜索-ICLR

Mamba-3惊现AI顶会ICLR 2026！CMU知名华人教授一作首代工作AI圈爆红

拒稿警告，靠大模型「偷摸水论文」被堵死，ICLR最严新规来了

简单即强大：全新生成模型「离散分布网络DDN」是如何做到原理简单，性质独特？

ICLR25|打开RL黑盒，首次证明强化学习存在内在维度瓶颈

强化学习的两个「大坑」，终于被两篇ICLR论文给解决了

Correlations：氛围测试你的向量模型

GPT-4o舔出事了！赛博舔狗背后，暗藏6大AI套路

谷歌DeepMind&CMU：过去引导LLM规划的方法是错的？ 用GRASE-DC改进。ICLR2025

ICLR 2025 | 无需训练加速20倍，清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

谷歌DeepMind&CMU：过去引导LLM规划的方法是错的？用GRASE-DC改进。ICLR2025