AI资讯新闻榜单内容搜索-RAG

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: RAG

RAG效果要提升，先搞定高质量Context Pruning

RAG效果要提升，先搞定高质量Context Pruning

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

10066 点击 2025-11-28 10:05

RAG被判死刑：Google用一行API架空工程师！

RAG被判死刑：Google用一行API架空工程师！

RAG被判死刑：Google用一行API架空工程师！

Google宣判RAG死刑！那条曾让无数工程师自豪的技术链，如今只剩下一行API调用。Gemini的File Search，把检索、分块、索引、引用，全都封进了模型内部。开发者不再需要理解流程，只需要上传文件。当智能被自动化吞并，工程师第一次发现，自己也成了被自动化的一部分。

来自主题: AI技术研报

11360 点击 2025-11-26 15:14

告别「一条路走到黑」：通过自我纠错，打造更聪明的Search Agent

告别「一条路走到黑」：通过自我纠错，打造更聪明的Search Agent

告别「一条路走到黑」：通过自我纠错，打造更聪明的Search Agent

为了同时解决知识的实时性和推理的复杂性这两大挑战，搜索智能体（Search Agent）应运而生。它与 RAG 的核心区别在于，Search Agent 能够通过与实时搜索引擎进行多轮交互来分解并执行复杂任务。这种能力在人物画像构建，偏好搜索等任务中至关重要，因为它能模拟人类专家进行深度、实时的资料挖掘。

来自主题: AI技术研报

8035 点击 2025-11-18 14:39

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

Zleap技术解密：后RAG时代已来，SAG重新定义AI搜索

大家好，我是Jomy，是智跃Zleap的CEO，也是Zleap产品和技术的主要设计者。此前在报道中，我曾粗略介绍过Zleap产品背后的技术：一个能帮助CEO自动整理、总结海量企业内部信息的智能Agent。今天，我要正式为大家介绍驱动这个Agent的底层技术：SAG。

来自主题: AI技术研报

11067 点击 2025-11-18 10:40

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

Memory和RAG的区别在哪？用「上下文工程」做出个性化 AI（谷歌白皮书精读）

谷歌在第三天发布了《上下文工程：会话与记忆》(Context Engineering: Sessions & Memory) 白皮书。文中开篇指出，LLM模型本身是无状态的 (stateless)。如果要构建有状态的（stateful）和个性化的 AI，关键在于上下文工程。

来自主题: AI技术研报

8303 点击 2025-11-14 10:22

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

7769 点击 2025-11-10 15:12

40页的上下文工程ebook「深度拆解」｜weaviate

40页的上下文工程ebook「深度拆解」｜weaviate

40页的上下文工程ebook「深度拆解」｜weaviate

如果你也在做 RAG 或智能体应用，大概经历过这些瞬间：文档切得太碎，答案失去上下文；切得太大，又召回不准；加了更多提示词，效果可能更不稳定。

来自主题: AI技术研报

8909 点击 2025-11-06 09:37

多智能体系统中，如何用向量数据库共享上下文？OpenAgents x Milvus

多智能体系统中，如何用向量数据库共享上下文？OpenAgents x Milvus

多智能体系统中，如何用向量数据库共享上下文？OpenAgents x Milvus

静态编排 VS 动态编排，谁是多agent系统最优解？通常来说，面对简单问题，采用react模式的单一agent就能搞定。可遇到复杂问题，单一agent就会立刻出现包括但不限于以下问题：串行执行效率低：无法同时完成并行的子步骤（如 “同时爬取 A、B 两个网站的数据”）。

来自主题: AI技术研报

9471 点击 2025-11-06 09:33

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

同样是语义相似度结合时效性做rerank，指数衰减、高斯衰减、线性衰减怎么选？假设你要在一个新闻应用中落地语义检索功能，让用户搜索雷军的投资版图盘点时，能自动关联顺为资本、小米战投等核心关联信息。

来自主题: AI技术研报

10338 点击 2025-11-05 09:46

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

大型语言模型（LLM）本身很强大，但知识是静态的，有时会“胡说八道”。为了解决这个问题，我们可以让它去外部知识库（比如维基百科、搜索引擎）里“检索”信息，这就是所谓的“检索增强生成”（RAG）。

来自主题: AI资讯

8452 点击 2025-10-25 14:09

上一页当前第6页,共26页下一页