AI资讯新闻榜单内容搜索-语言模型

北航等机构发布最新综述：大语言模型集成 | ArXiv 2025

LLM Ensemble（大语言模型集成）在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段，综合考虑并利用多个大语言模型（每个模型都旨在处理用户查询），从而发挥它们各自的优势。大语言模型的广泛可得性，以及其开箱即用的特性和各个模型所具备的不同优势，极大地推动了 LLM Ensemble 领域的发展。

来自主题: AI技术研报

10160 点击 2025-06-17 17:03

首个全面梳理语音大模型发展脉络的权威综述，入选ACL 2025主会

由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收！这是该领域首个全面系统的综述，为语音 AI 的未来发展指明了方向。

来自主题: AI技术研报

9116 点击 2025-06-17 16:45

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

思维链（Chain of Thought, CoT）推理方法已被证明能够显著提升大语言模型（LLMs）在复杂任务中的表现。而在多模态大语言模型（MLLMs）中，CoT 同样展现出了巨大潜力。

来自主题: AI技术研报

10934 点击 2025-06-17 10:21

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。

来自主题: AI技术研报

8261 点击 2025-06-17 10:15

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

9537 点击 2025-06-17 09:46

如何选择最佳多模态大模型压缩方案？哈工大、度小满开源EFFIVLM-BENCH基准测试框架

在金融科技智能化转型进程中，大语言模型以及多模态大模型（LVLM）正成为核心技术驱动力。尽管 LVLM 展现出卓越的跨模态认知能力

来自主题: AI技术研报

9776 点击 2025-06-16 15:27

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型，MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势，这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报

9581 点击 2025-06-16 15:24

模型遗忘不代表记忆抹除！首次系统发现「可逆性遗忘」背后规律

研究人员发现，大语言模型的遗忘并非简单的信息删除，而是可能隐藏在模型内部。通过构建表示空间分析工具，区分了可逆遗忘和不可逆遗忘，揭示了真正遗忘的本质是结构性的抹除，而非行为的抑制。

来自主题: AI技术研报

7989 点击 2025-06-14 16:09

EchoEar（喵伴）：乐鑫发布与火山引擎扣子联名 AI 智能体开发板

随着生成式人工智能技术的快速发展，大语言模型 (LLM) 正逐步成为推动智能设备升级的核心力量。乐鑫科技携手火山引擎扣子大模型团队，共同推出智能 AI 开发套件 —— EchoEar（喵伴）。该套件以端到端开发为核心理念，构建起从硬件接入、智能体构建到生态联动的一站式开发流程，为开发者提供了一条高效、开放、具备可复制性的落地路径。

来自主题: AI资讯

13205 点击 2025-06-13 14:40

喝点VC｜a16z谈搜索大变局：搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式

搜索行为从传统浏览器向大型语言模型（LLM）平台迁移，价值超800亿美元的SEO市场根基已现裂痕，搜索迈入由语言模型主导的“生成式引擎优化（GEO）”全新范式。

来自主题: AI资讯

9620 点击 2025-06-12 18:08