腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破
6717点击    2025-09-14 10:45

图检索增强生成(GraphRAG)已成为大模型解决复杂领域知识问答的重要解决方案之一。然而,当前学界和开源界的方案都面临着三大关键痛点:


  • 开销巨大:通过 LLM 构建图谱及社区,Token 消耗大,耗时长,经济与时间成本高昂。
  • 效果瓶颈:对复杂问答的解析精度有限,面临显著的效果瓶颈。
  • 适配成本高:缺乏跨任务泛化能力,遇新领域需重新调整全链路,迁移成本高。


针对这些难题,腾讯优图实验室正式开源 Youtu-GraphRAG 框架,通过创新的算法优化,实现了成本和效果的双重突破!


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破



  • 论文标题:Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning
  • 论文链接:https://arxiv.org/pdf/2508.19855


成本和效果的双重突破


在六个跨领域多语言基准测试中,Youtu-GraphRAG 展现出卓越性能:


  • 大幅成本优化:相比同类最佳方案,构图成本节省 30%+;
  • 显著精度提升:在复杂推理任务中获得最高 16%+ 的准确率提升;


这些结果标志着 GraphRAG 技术向落地可用的发展阶段迈进了重要的一步。


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


技术架构:三大创新构建垂直统一的完整方案


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


Youtu-GraphRAG 通过 Schema 连接两个智能体,在图构建、索引和检索上实现垂直统一和认知闭环,以领先的落地级图构建与推理能力推动 GraphRAG 进入新的阶段。


1. Schema 引导的层次化知识树构建


通过引入有针对性的实体类型、关系和属性类型,为图构建智能体提供精确约束,实现了跨领域知识的自主演化和高质量抽取。四层架构设计包括:


  • 属性层:存储实体的属性信息
  • 关系层:构建实体间的关系三元组
  • 关键词层:建立关键词索引体系
  • 社区层:形成层次化的高维度社区结构


2. 结构语义双重感知的社区检测


巧妙融合结构拓扑特征与子图语义信息,在复杂网络中提炼高维度知识加强推理总结能力,社区生成效果显著优于传统 Leiden 和 Louvain 算法。利用大模型进行社区摘要生成,实现更高层次的知识抽象。


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


3. 智能迭代检索机制


深度理解图 Schema,将复杂查询针对性地转换为符合图特征且可并行处理的子查询,通过迭代检索进一步提升思维链追溯与反思能力。


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


When & Why? 三大核心应用场景


多跳推理与总结


完美解决需要多步推理的复杂问题,如深度关联分析、因果推理等场景。


知识密集型任务


高效处理依赖大量结构化知识的问题,如企业知识库问答、技术文档深度解析。


跨域扩展应用


轻松支持学术论文、个人知识库、私域 / 企业知识库等多个领域,最小化人工干预成本。


交互界面


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


快速启动:四步开箱智能复杂问答


第一步:获取项目代码


git clone https://github.com/TencentCloudADP/youtu-graphrag

cd youtu-graphrag


第二步:环境配置  


1. 首先访问提供模型服务的平台,获取远程调用模型的凭证 API key。


2. 按照.env.example 格式创建配置文件,创建并复制 API key,`Youtu-GraphRAG` 项目的 `.env` 文件中的 llm 部分中设置。


cp .env.example .env

# 配置 OpenAI 格式的 LLM API

# LLM_MODEL=deepseek-chat

# LLM_BASE_URL=https://api.deepseek.com

# LLM_API_KEY=sk-xxxxxx


第三步:一键部署  


docker build -t youtu_graphrag:v1 .

# 启动 docker 容器

docker run -d -p 8000:8000 youtu_graphrag:v1


第四步:体验交互 


curl -v http://localhost:8000


访问 http://localhost:8000 即可体验完整的图增强推理服务,包括:


  • 可视化知识图谱展示
  • 交互式智能问答
  • 实时推理路径追踪


企业级优势特性


统一配置管理


  • 集中化参数管理:所有组件通过单一 YAML 文件统一配置
  • 多环境无缝支持:轻松实现跨领域迁移部署


高性能架构


  • 并行子问题处理:采用并行机制处理分解后的问题
  • 迭代推理演进:逐步构建答案,提供清晰的推理轨迹
  • 企业级扩展性:专为私域及企业级部署而设计


社区贡献与数据集


我们提供公平匿名数据集  AnonyRAG  ,有效防范大语言模型预训练过程中的知识泄露问题,深度检验 GraphRAG 框架的检索性能。


我们致力于构建一个开放、灵活的知识图谱检索与推理框架。无论你是研究者、工程师,还是对知识图谱与 RAG 有兴趣的开发者,都可以在以下方向贡献:


新种子 Schema 开发:


设计并提交高质量的种子 Schema,帮助 GraphRAG 更好地理解不同数据类型。


示例:为医疗领域构建患者、药物、治疗方案的种子 Schema


自定义数据集集成:


在尽量减少对 Schema 的人工干预下,尝试集成新的开放数据集或行业数据集。


示例:


  • 集成 WikiData、PubMed、arXiv 等开放数据集
  • 集成企业内部文档或日志数据,并验证 Graphrag 的兼容性


特定领域的最佳实践应用案例


展示 GraphRAG 在某一领域的最佳实践,让社区更直观地了解其应用潜力。


示例:


  • 金融领域:构建基于 Graphrag 的风险事件知识图谱
  • 教育领域:集成课程大纲、作业与考试题库,辅助智能问答
  • 科研领域:集成论文数据集,支持跨学科知识发现


立即体验


Youtu-GraphRAG 不仅代表了图检索增强生成技术的最新进展,更为企业级知识管理和智能问答系统设立了新的标杆。其突破性的成本效益比和精度提升,让高质量智能问答服务变得更加可及和可持续。


立即体验 Youtu-GraphRAG,开启智能问答的新篇章!  


扫码前往 GitHub 获取源代码:


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


扫码加入技术讨论社群:


请添加小助手微信并说明 “加入 Youtu-GraphRAG 社群”,通过后将拉你入群:


腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破


文章来自于微信公众号 “机器之心”,作者 “机器之心”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI