DeepSeek-R1 x Agentic RAG：构建带"深度思考"开关的知识研究助理

DeepSeek-R1 x Agentic RAG：构建带"深度思考"开关的知识研究助理｜深度长文

8459点击 2025-03-05 11:07

RAG是一种基于“检索结果”做推理的应用，这大大限制了类似DeepSeek-R1模型的发挥空间。但又的确存在将RAG的准确性与DeepSeek深度思考能力结合的场景，而不仅仅是回答事实性问题。比如：

基于企业知识库与产品文档，写一份市场分析报告。
根据已有的技术报告创作一篇公众号文章。

你很难用传统的RAG方法去“回答”这样的主题；也无法快速的更换DeepSeek就输出需要的结果。本文将介绍如何结合DeepSeek-R1与Agentic RAG方法以构建带有“深度思考”开关的问答与研究助理。请注意这个开关并不是简单的换模型：

DeepSeek-R1 x Agentic RAG：构建带

01 工作流程设计

实际应用中的上述场景存在这样的一些典型特点或业务需要：

需要借助RAG以获得参考文档与知识，这本质是提升准确性
必要时使用互联网搜索获得更多外部信息，比如了解竞品
生成的结果不是简单的答案，而需要有良好的内容条理与结构

这样场景中你无法直接让模型”深度思考“出你需要的结果。因为这里的输出并不仅仅依赖于模型的生成能力，更需要参考足够的私域知识，而这些知识则需要借助RAG或搜索引擎来检索。或者说，复杂度更多体现在研究结构的规划与关联知识的检索。

因此考虑这样一种方案：

借助DeepSeek思考与规划研究大纲、并提出针对性的问题
借助RAG引擎来回答这些提出的问题，答案作为参考知识
综合这些问题及答案，并根据规划的大纲生成最终研究结果

我们设计如下的Agentic Workflow：

DeepSeek-R1 x Agentic RAG：构建带

流程详细描述如下：

为了让这个Agent既能够支持简单的事实性问答，也能切换做深入的研究，设计DeepResearch这样的开关，把选择权交给用户；
如果无需深度思考，则直接调用Agentic RAG回答问题；
如果需要深度思考，则进入如下流程：

生成大纲：借助DeepSeek的深度思考能力，根据输入主题先构建一个研究大纲，确保输出的结构化与全面性
问题规划：基于大纲生成一份必要的研究问题清单，以有效的检索到研究所需要的知识
问题回答：获得这些问题的答案，这个步骤借助已构建好的Agentic RAG系统来获得，以确保获得参考信息的准确性。这一步可以并行开展
起草答案：将搜集到的问题与答案，结合规划的提纲，交给LLM进行创作，生成研究结果的草稿
内容审核：审查草稿的完整性、准确性与连贯性，并确定是否需要修改或增补，并输出新的问题来进一步搜集信息
最终输出：在经过指定次数的迭代后，输出最终结果

可以看到，RAG系统在这成为了后端的一个“研究工具”。为了更具扩展性，我们借助Agentic RAG方法来实现，并增加了搜索引擎作为补充的知识来源：

DeepSeek-R1 x Agentic RAG：构建带

这种Agentic RAG可以更灵活的跨越多个数据源（比如不同的知识库/文档）、跨越多种类型RAG管道（比如回答事实性问题与总结性问题）及互联网搜索工具等来回答问题，以提供研究需要的参考信息。

这样的工作流程优势在于：通过先推理大纲与假设性问题来提高信息获取的覆盖面与引用密度，同时又能借助RAG检索私有知识，提高准确性；同时还利用反思模式来提高最终的生成质量。当然缺点是流程较长，但对于这样的研究是可以接受的。

02 实现：Agentic RAG应用

现在来实现这个具有“深度思考”能力的Agentic Workflow，我们采用的工具为：

Agentic RAG系统使用LlamaIndex+Chroma向量库+gpt-4o-mini
Workflow编排使用LlamaIndex Workflows
deepseek-r1模型作为大纲生成、研究报告创作
gpt-4o-mini用作问题规划、报告审核

首先来实现这里的Agentic RAG应用，对于无需“深度思考”的问题，这个应用就是直接回答问题的主体。构建基本过程如下：

创建一个/多个RAG查询管道（如有需要，可支持多模态）
将这些查询管道“工具化”
创建一个网络搜索工具
将RAG与搜索工具交给一个FunctionCalling的Agent使用即可

核心代码参考（可根据需要调整关键词）：

......

#RAG查询引擎

query_engine = vector_index.as_query_engine(similarity_top_k=5,llm=llm_openai)

query_tool = QueryEngineTool.from_defaults(query_engine=query_engine,name=f'query_tool_{name}',

description=f'用来查询DeepSeek-R1的技术细节')

...

#搜索工具

search_tool = FunctionTool.from_defaults(fn=web_search,name = 'search_tool',description='用来搜索网络以获取信息')

#RAG agent

rag_agent = FunctionCallingAgent.from_tools(

[query_tool,search_tool],

llm=llm_openai,

system_prompt="""

你是一个问题回答专家。你必须使用工具查询技术细节或搜索网络信息，并始终用中文回答问题。

* 尽量保留工具返回中的Markdown图片信息。* 如果一个工具无法回答问题，请尝试另一个工具。

不要基于先验知识或编造。""")

你可以在构建完这个Agent以后，先测试该Agent的工具推理与回答能力，以确保能够为后面的研究提供准确的信息。比如用如下代码测试：

agent_response = rag_agent.query("How is DeepSeek-R1-Zero AIME accuracy during training")
display(Markdown(str(agent_response)))

我的Agent反馈如下（实现了多模态RAG）：

DeepSeek-R1 x Agentic RAG：构建带

03 实现：编排Workflow

准备好Agentic RAG这个“工具”后，接下来实现深度思考的主流程。

我们基于LlamaIndex的Workflows来构建（当然你完全也可以使用LangGraph），根据上面的设计，这个workflow编排后的可视化如下：

DeepSeek-R1 x Agentic RAG：构建带

这里的核心步骤（在LlamaIndex中称作step）包括：

route_request: 根据是否需要深度思考做路由
plan_outline: 思考与规划研究大纲，使用deepseek
plan_questions: 根据研究的大纲设计问题，使用gpt-4o
answer_question: 并行调用已经创建Agentic RAG获得问题答案
general_final_answer: 根据大纲、问题/答案生成结果，deepseek
review_final_answer: 检查审核，如果没有问题或达到最大迭代次数，则结束；否则生成新的问题，返回answer_question获取更多信息

整个过程的重点是精心设计每个step的提示词，剩下的工作以调用LLM与RAG为主，并不复杂。以其中的问题设计（plan_questions）这个step为例：

...

# 根据大纲提出一些问题

@step()

async def plan_questions(

self, ctx: Context, ev: OutlineEvent

) -> QuestionEvent:

#事件中的大纲信息，并保存到上下文，后面步骤中要用

outline = ev.outline

await ctx.set("outline", outline)

#上下文中获取原始问题

query = await ctx.get("original_query")

#Prompt提示

prompt = f"""你需要根据输入的问题和回答大纲制定一系列问题，这些问题将帮助获得完成大纲所需的事实：

* 你不能假设任何现有的知识

* 问题需要涵盖大纲中的所有主要要点

* 每一个问题必须自洽完整，不能依赖于上下文

* 你的输出应该是一个问题列表，每个问题在新的一行

* 问题最多不超过5个

----------------

输入问题：{query}

----------------

回答大纲：{outline}"""

#生成问题（调用LLM）

response = await llm_openai.acomplete(prompt)

#取出<think>部分，如果你使用deepseek-r1才需要

response = re.sub(r"<think>.*?</think>", "", str(response), flags=re.DOTALL)

questions = response.split("\n")

questions = [x for x in questions if x]

#问题数量

await ctx.set("num_questions", len(questions))

#触发下一个step，并传递问题

#这里会触发并行处理

for question in questions:

ctx.send_event(QuestionEvent(question=question))

再比如回答问题（answer_question)这一步：

...

@step()

async def answer_question(

self, ctx: Context, ev: QuestionEvent

) -> AnswerEvent:

#取出问题

question = ev.question

#调用上面创建的agentic rag获得答案

response = await rag_agent.aquery(question)

#如果打开“深度思考”，则触发下一步；否则就结束！

if (await ctx.get("deepresearch")):

return AnswerEvent(question=question, answer=str(response))

else:

return StopEvent(result=str(response))

其他步骤可以按照类似方式来编写，最终完成Workflow的定义。

04 测试Workflow

现在可以测试调用这个Workflow，你可以打开或者关闭“深度思考”这个参数，以控制是普通的RAG问答，还是开展深度研究。

首先关闭“深度思考”（deepresearch=False）

async def main():

#workflow实例

rsearch_agent = DeepResearchAgent(timeout=600, verbose=True)

#调用，deepresearch为控制开关

handler = rsearch_agent.run(

query ="DeepSeek-R1大模型用了什么技术？国际上评价如何",

deepresearch = False,

rag_agent = rag_agent

)

final_result = await handler

print(final_result)

观察输出内容：

DeepSeek-R1 x Agentic RAG：构建带

然后打开深度思考（deepresearch=True）

通过跟踪信息，你可以看到研究助手生成了如下的大纲与假设提问：

DeepSeek-R1 x Agentic RAG：构建带

针对这个大纲，LLM设计的问题如下（首次迭代）：

DeepSeek-R1 x Agentic RAG：构建带

05 未来的改进

在测试发现的一些潜在问题及其未来的改进空间：

过于发散思维的研究提纲可能导致无法查询到必要的参考信息（或者会过于依赖网络搜索）。在最终答案可能会有这样的体现（有提纲，但没有答案）：

DeepSeek-R1 x Agentic RAG：构建带

优化方法可以考虑：

在生成大纲时给予更多的提示信息，比如已有知识目录、增加限制条件等
在Review环节多次迭代仍然无法检索到相关知识后，对这部分做删除。

多模态的支持需进一步增强。很多场景需要产出一份图文兼备的研究文档，这可能需要在最后的生成环节做进一步结构化输出的控制与优化。

输出形态多样化。借助于一些开放库，可以将最终的结果根据需要输出成Word、PPT、思维导图等更丰富的格式（相对于生成公式化的通用PPT，基于私有知识与文档生成的PPT是不是更有价值呢)。

文章来自微信公众号 “ AI大模型应用实践 “，作者秋山墨客

DeepSeek-R1 x Agentic RAG：构建带

关键词: RAG , 检索增强 , AI , 人工智能 , 知识库

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0