AI资讯新闻榜单内容搜索-大型语言模型

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。

来自主题: AI技术研报

9037 点击 2025-12-16 09:18

NeurIPS 2025 | DePass：通过单次前向传播分解实现统一的特征归因

随着大型语言模型在各类任务中展现出卓越的生成与推理能力，如何将模型输出精确地追溯到其内部计算过程，已成为 AI 可解释性研究的重要方向。然而，现有方法往往计算代价高昂、难以揭示中间层的信息流动；同时，不同层面的归因（如 token、模型组件或表示子空间）通常依赖各自独立的特定方法，缺乏统一且高效的分析框架。

来自主题: AI技术研报

5525 点击 2025-12-01 13:49

17万条推理轨迹扒出AI推理的真相：有劲儿，但用错了地方｜哈佛新论文解读

而今天，来自 UIUC、华盛顿大学等机构的一群研究人员，通过一篇重磅论文《推理的认知基础及其在大型语言模型中的体现》，为这个“认知鸿沟”画出了一张精确的微观解剖图。

来自主题: AI技术研报

7741 点击 2025-11-29 20:10

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

当美国巨头如Google、OpenAI 和 Anthropic 竞相开发支撑其 AI 产品的大型语言模型时，Sakana AI、Mistral AI、DeepSeek 和 AI21 Labs 等初创公司正凭借为特定地区、行业或独特功能设计的专业模型开辟自己的细分市场。

来自主题: AI资讯

8905 点击 2025-11-18 16:35

Agent的RL和LLM的RL是一回事吗？牛津用500+论文写成综述，一次说清Agentic RL

当我们谈论大型语言模型（LLM）的"强化学习"（RL）时，我们在谈论什么？从去年至今，RL可以说是当前AI领域最炙手可热的词汇。

来自主题: AI技术研报

9598 点击 2025-11-18 15:11

微信、清华连续自回归模型CALM，新范式实现从「离散词元」到「连续向量」转变

众所周知，大型语言模型（LLM）的根本运作方式是预测下一个 token（词元），能够保证生成的连贯性和逻辑性，但这既是 LLM 强大能力的「灵魂」所在，也是其枷锁，将导致高昂的计算成本和响应延迟。可

来自主题: AI技术研报

7340 点击 2025-11-09 10:21

如何自动优化领域任务的提示词？用EGO-Prompt｜NeurIPS 2025

大型语言模型（LLMs）正迅速成为从金融到交通等各个专业领域不可或缺的辅助决策工具。但目前LLM的“通用智能”在面对高度专业化、高风险的任务时，往往显得力不从心。

来自主题: AI技术研报

7495 点击 2025-11-07 10:52

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型，扩散语言模型的推理性能和效率大幅提升

扩散大语言模型得到了突飞猛进的发展，早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型，同期人民大学发布第一个开源 8B 扩散大语言模型 LLaDA，5 月份 Gemini Diffusion 也接踵而至。

来自主题: AI技术研报

9233 点击 2025-11-05 15:17

从兼职工程师直接跳到CTO，他用两个月让一款 Agent 干掉60%复杂工作并放话：“代码质量与产品成功没有直接关系”！

在 AI 与自动化方面，Block 在 2025 年初推出了一个名为 “Goose” 的开源 AI Agent 框架。Goose 的设计初衷是：将大型语言模型输出与实际系统行为（如读取／写入文件、运行测试、自动化工作流）连接起来，从而不仅让模型能“聊”而且能“干活“。

来自主题: AI资讯

7221 点击 2025-10-31 14:57

可攻可防，越狱成功率近90%！六大主流模型全中招 | EMNLP'25

聚焦大型语言模型（LLMs）的安全漏洞，研究人员提出了全新的越狱攻击范式与防御策略，深入剖析了模型在生成过程中的注意力变化规律，为LLMs安全研究提供了重要参考。论文已被EMNLP2025接收

来自主题: AI技术研报

5434 点击 2025-10-27 10:25