AI资讯新闻榜单内容搜索-语言模型

从物竞天择到智能进化，首篇自进化智能体综述的ASI之路

近年来，大语言模型（LLM）已展现出卓越的通用能力，但其核心仍是静态的。面对日新月异的任务、知识领域和交互环境，模型无法实时调整其内部参数，这一根本性瓶颈日益凸显。

来自主题: AI技术研报

8504 点击 2025-08-13 11:32

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。

来自主题: AI技术研报

8623 点击 2025-08-12 11:07

从开源项目到2500万美元融资：如何打造下一代AI Agent的互联网基础设施

Tavily AI 的故事开始于一个开源项目。创始人 Rotem Weiss 在 2023 年创建了一个叫做 GPT Researcher 的开源工具，目的是让大语言模型能够获取实时的网络数据。当时 ChatGPT 还没有接入互联网搜索功能，这个小工具迅速在开发者社区中走红，收获了近 2 万个 GitHub stars。

来自主题: AI资讯

10537 点击 2025-08-11 14:14

token危机解决？扩散模型数据潜力3倍于自回归，重训480次性能仍攀升

扩散语言模型（DLMs）是超强的数据学习者。 token 危机终于要不存在了吗？近日，新加坡国立大学 AI 研究者 Jinjie Ni 及其团队向着解决 token 危机迈出了关键一步。

来自主题: AI资讯

7652 点击 2025-08-11 10:53

联合理解生成的关键拼图？腾讯发布X-Omni：强化学习让离散自回归生成方法重焕生机，轻松渲染长文本图像

在图像生成领域，自回归（Autoregressive, AR）模型与扩散（Diffusion）模型之间的技术路线之争始终未曾停歇。大语言模型（LLM）凭借其基于「预测下一个词元」的优雅范式，已在文本生成领域奠定了不可撼动的地位。

来自主题: AI技术研报

8051 点击 2025-08-11 10:17

告别数据标注！SQLM让大模型自我博弈，RL自主推理新范式！

一句话概括，本文探索了语言模型的终极内卷模式：不再依赖人类投喂，通过“自问自答”的左右互搏，硬生生把自己逼成了学霸。AlphaGo下棋我懂，这大模型自己给自己出数学题做就有点离谱了，堪称AI界的“闭关修炼”，出关即无敌。

来自主题: AI资讯

9661 点击 2025-08-10 14:29

ARPO：智能体强化策略优化，让Agent在关键时刻多探索一步

在可验证强化学习（RLVR）的推动下，大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中，LLM 往往需要结合外部工具进行多轮交互，现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。

来自主题: AI技术研报

7993 点击 2025-08-10 13:29

扩散LLM推理新范式：打破生成长度限制，实现动态自适应调节

随着 Gemini-Diffusion，Seed-Diffusion 等扩散大语言模型（DLLM）的发布，这一领域成为了工业界和学术界的热门方向。但是，当前 DLLM 存在着在推理时必须采用预设固定长度的限制，对于不同任务都需要专门调整才能达到最优效果。

来自主题: AI资讯

8814 点击 2025-08-09 11:16

从Debugger到Developer : 低代码时代新基准NoCode-bench，SWE-Bench作者力荐

当前，大型语言模型（LLM）在软件工程领域的应用日新月异，尤其是在自动修复 Bug 方面，以 SWE-bench 为代表的基准测试展示了 AI 惊人的潜力。然而，软件开发远不止于修 Bug，功能开发与迭代才是日常工作的重头戏。

来自主题: AI技术研报

8557 点击 2025-08-08 17:01

AI 科普丨都2025年了，人们到底在用AI做什么？国外大牛总结了100个案例

近一年来，围绕人工智能（AI）、生成式 AI（GenAI）和大语言模型（LLM）的炒作愈演愈烈，大众的兴趣翻了一番，针对 AI 的投资激增，各国政府也采取了更加明确的立场。根据一些人的说法，AI 与人类的未来息息相关。

来自主题: AI资讯

8516 点击 2025-08-08 12:41