AI资讯新闻榜单内容搜索-上下文

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

这几天，关于「微调已死」的言论吸引了学术圈的广泛关注。一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering（智能体 / 主动式上下文工程）的技术，让语言模型无需微调也能实现自我提升！

来自主题: AI技术研报

9038 点击 2025-10-15 12:14

第二代InfLLM开源，同尺寸快三倍！零参数，可训练稀疏注意力

InfLLM-V2是一种可高效处理长文本的稀疏注意力模型，仅需少量长文本数据即可训练，且性能接近传统稠密模型。通过动态切换短长文本处理模式，显著提升长上下文任务的效率与质量。从短到长低成本「无缝切换」，预填充与解码双阶段加速，释放长上下文的真正生产力。

来自主题: AI技术研报

9353 点击 2025-10-13 11:55

通用模型无法完全理解用户，AI产品的下一站是上下文的战场｜对话AI知识助手remio

在量子位智库的观察中，AI知识助手remio正在尝试这一方向。remio主打无感和自动化，致力于变成记忆和用户同频的第二大脑。主打能够在用户无感知的情况下，实时、自动化地采集用户所需管理的信息，为用户创造更加轻松顺畅的使用体验。

来自主题: AI资讯

11488 点击 2025-10-12 15:48

斯坦福新论文：微调已死，自主上下文当立

来自斯坦福大学、SambaNova Systems公司和加州大学伯克利分校的研究人员，在新论文中证明：依靠上下文工程，无需调整任何权重，模型也能不断变聪明。他们提出的方法名为智能体上下文工程ACE。

来自主题: AI技术研报

7574 点击 2025-10-11 11:45

斯坦福最新：上下文只能写死在prompt里？用ACE把经验写进可演化上下文『附系统提示』

调模型不如“管上下文”。这篇文章基于 ACE（Agentic Context Engineering），把系统提示、运行记忆和证据做成可演化的 playbook，用“生成—反思—策展”三角色加差分更新，规避简化偏置与上下文塌缩。在 AppWorld 与金融基准上，ACE 相较强基线平均提升约 +10.6% 与 +8.6%，适配时延降至约 1/6（-86.9%），且在无标注监督场景依然有效。

来自主题: AI技术研报

10747 点击 2025-10-11 11:31

Jina Reranker v3: 全新“列式”重排器，0.6B参数刷新文档检索SOTA

我们正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现（SOTA）。这是一款仅有 6 亿参数的多语言重排模型。我们为其设计了名为 “last but not late” （中文我们译作后发先至）的全新交互机制，使其能接受 Listwise 即列式输入，在一个上下文窗口内一次性完成对查询和所有文档的深度交互。

来自主题: AI技术研报

11106 点击 2025-10-10 13:11

别卷 Prompt 了，上下文工程正在淘汰你

Hi，返工早上好。我是洛小山，和你聊聊 AI 行业思考。 AI Agent 应用的竞争逻辑，正在发生根本性变化。当许多团队还在死磕提示词优化（PE 工程）时，一些优秀团队开始重心转向了上下文工程

来自主题: AI技术研报

8148 点击 2025-10-09 11:59

EMNLP 2025 | CARE：无需外部工具，让大模型原生检索增强推理实现上下文高保真

近日，来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架，一个新颖的原生检索增强推理框架，教会 LLM 将推理过程中的上下文事实与模型自身的检索能力有机结合起来。该框架现已全面开源，包括训练数据集、训练代码、模型 checkpoints 和评估代码，为社区提供一套完整的、可复现工作。

来自主题: AI技术研报

8609 点击 2025-10-07 22:10

Jina官方MCP三板斧：搜、读、筛

模型上下文协议 (MCP) 是连接 LLM/Agent 与外部工具的通信标准。它允许 LLM 动态发现并调用 API工具，将他们串成一个完整的工作流，从而实现自主规划、推理与执行。上个月我们悄悄发布

来自主题: AI技术研报

10506 点击 2025-10-06 13:23

AI Agent落地血泪史，教会了我什么？

构建有价值的AI Agent需审慎选择场景，避免滥用。应用前需评估任务复杂性、价值是否匹配成本、模型核心能力有无硬伤及出错风险容忍度。开发时坚持极简原则，聚焦环境、工具集、系统提示三大核心要素。优化调试的关键在于理解Agent有限上下文视角，模拟其受限决策状态。

来自主题: AI资讯

8335 点击 2025-09-30 15:28