AI资讯新闻榜单内容搜索-大语言模型

ARPO：智能体强化策略优化，让Agent在关键时刻多探索一步

在可验证强化学习（RLVR）的推动下，大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中，LLM 往往需要结合外部工具进行多轮交互，现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。

来自主题: AI技术研报

6377 点击 2025-08-10 13:29

扩散LLM推理新范式：打破生成长度限制，实现动态自适应调节

随着 Gemini-Diffusion，Seed-Diffusion 等扩散大语言模型（DLLM）的发布，这一领域成为了工业界和学术界的热门方向。但是，当前 DLLM 存在着在推理时必须采用预设固定长度的限制，对于不同任务都需要专门调整才能达到最优效果。

来自主题: AI资讯

7207 点击 2025-08-09 11:16

AI 科普丨都2025年了，人们到底在用AI做什么？国外大牛总结了100个案例

近一年来，围绕人工智能（AI）、生成式 AI（GenAI）和大语言模型（LLM）的炒作愈演愈烈，大众的兴趣翻了一番，针对 AI 的投资激增，各国政府也采取了更加明确的立场。根据一些人的说法，AI 与人类的未来息息相关。

来自主题: AI资讯

6562 点击 2025-08-08 12:41

字节&MAP重塑大模型推理算法优化重点，强化学习重在高效探索助力LLM提升上限

强化学习（RL）范式虽然显著提升了大语言模型（LLM）在复杂任务中的表现，但其在实际应用中仍面临传统RL框架下固有的探索难题。

来自主题: AI资讯

7211 点击 2025-08-08 11:06

人大高瓴-华为诺亚：大语言模型智能体记忆机制的系列研究

近期，基于大语言模型的智能体（LLM-based agent）在学术界和工业界中引起了广泛关注。对于智能体而言，记忆（Memory）是其中的重要能力，承担了记录过往信息和外部知识的功能，对于提高智能体的个性化等能力至关重要。

来自主题: AI技术研报

6360 点击 2025-08-07 17:03

a16z重磅预测：Vibe coding赢者通吃？错了，垂直专业化才是未来

你有没有发现，AI 应用生成平台们正在走向一条与大家预期完全不同的路？很多人原本以为这会是一场血腥的零和游戏，大家会在价格战中厮杀到底，最终只剩一家独大。但现实却让人意外：这些平台不但没有互相厮杀，反而开始各自寻找差异化的定位，在不同的细分市场中共存共荣。这让我想起了大语言模型市场的发展轨迹，同样出人意料，同样充满启发。

来自主题: AI资讯

6248 点击 2025-08-07 11:48