自从生成式 AI 和 LLM 在世界舞台上占据中心位置以来,员工们一直在思考如何最好地将这些变革性的新工具应用于他们的工作流程。然而,他们中的许多人在尝试将生成式 AI 集成到企业环境中时遇到了类似的问题,例如隐私泄露、缺乏相关性以及需要更好的个性化结果。
为了解决这个问题,大多数人得出结论,答案在于检索增强生成 (RAG)。RAG 通过企业搜索等外部发现系统将知识检索与生成过程分开。这使得 LLM 及其提供的响应能够以真实的外部企业知识为基础,这些知识可以很容易地浮出水面、追溯和参考。
来源:
https://www.glean.com/blog/hybrid-vs-rag-vector
企业智能知识库企业Glean利用GraphRAG融资2.6亿美元
既然企业明白生成式 AI 解决方案需要单独的检索解决方案,许多人会问 — 为什么我们不将内容放入矢量数据库并实施简单的 RAG 提示呢?遗憾的是,答案并不那么简单,尤其是在提供真正的企业级体验时。
让我们简要探讨一下向量搜索和数据库如何用于数据索引和检索。嵌入模型可以有效地将特定文本映射到固定的数字向量 - 给定一组单词,模型将分配一个数值,在数据库中表示该文本。然后,给定查询的文本,系统可以计算查询中的文本与该向量空间中预先索引的文档文本的“接近”程度,然后将其提取以显示在结果中。
嵌入模型将文本映射到固定的数字向量
此步骤应仅用作信息检索过程。然后,LLM 被严格用作推理层,最初调用搜索/检索引擎,读取有限的上下文,然后通过向量数据库根据正确的信息提取并生成连贯的响应。
检索增强生成 (RAG)
尽管矢量搜索的改进标志着语义理解的根本转变,但它只是为企业搜索提供高质量结果的一小部分拼图。仅靠简单的矢量搜索无法识别组织内所有内容、人员和活动之间更复杂的联系。
更过时的是简单的词法搜索系统,它们直接将查询词与文档内容和元数据词匹配。虽然易于实现,但它们只能利用数据库中单词或短语的精确匹配,这会带来严重的限制,尤其是在提供查询时遇到人为错误时。
相反,利用混合搜索系统的解决方案可以提供世界上最好的。例如,Glean的复杂RAG解决方案具有四个核心技术差异化因素,使其混合搜索和生成式AI解决方案与众不同:
Glean 稳健结果的核心是知识图谱 — 一个由无数信号和锚点组成的网络,它们都致力于解决潜在构建者必须解决的问题。这些因素帮助 Glean 获得组织内所有文档、人员和活动背后的丰富背景,从而帮助模型更好地告知模型交付出色结果所需的信息。简而言之,信号和锚点就像解开谜团所需的线索。解决方案必须使用的越多,结果就越好!
例如,Glean's signals 正在积极解决单个搜索和个性化问题,例如:
无数的锚点和信号帮助为每个企业构建独特的知识图谱
那么,具有复杂 RAG 解决方案的系统与没有 RAG 解决方案的系统之间有什么区别呢?让我们看一下一些生成结果的快速示例。
在 Glean,Scholastic 是将语义搜索集成到排名堆栈中的方法,专注于基于标题、锚点和标题的检索和评分。让我们看看当被问及 Scholastic 时,与 Glean 相比,标准的 RAG 解决方案可能会如何回答:
标准回答(Vector、简单 RAG)
Q: What is Scholastic?
Q:什么是 Scholastic?
A: Scholastic, located in New York City, New York, is a publisher and distributor of children's books, educational technology, and related services…
答:Scholastic 位于纽约州纽约市,是儿童读物、教育技术和相关服务的出版商和分销商......
Glean (Hybrid, complex RAG)
Glean (混合、复杂、Graph RAG)
Q: What is Scholastic?
Q:什么是 Scholastic?
A: Scholastic is our learned vector-based retrieval and scoring system (a play on our keyword-based system, Elastic). It learns item embeddings for documents and messages, and retrieves / scores nearest neighbors for a given query...
答:Scholastic 是我们学习的基于向量的检索和评分系统(我们基于关键字的系统 Elastic 的玩法)。它学习文档和消息的项嵌入,并检索/评分给定查询的最近邻居......
标准响应与工作查询完全无关,而 Glean 的响应理解分配并准确提供用户正在寻找的内容。
无论是生成式 AI 提供的响应,还是在搜索中提供的结果,由信号和锚点网络增强的混合、复杂的 RAG 解决方案都比不完整的词汇或向量搜索解决方案提供更好的结果。利用专有数据作为微调模型的关键和线索的能力为企业环境提供了搜索和生成式 AI 解决方案所需的丰富情境化。
专有数据是微调和嵌入分数的关键
在企业搜索领域,同样明显的是,仅依靠向量或语义搜索可能并不总是产生最佳结果。在需要精确性的情况下尤其如此,例如在搜索特定术语、文档或关键字时。向量搜索具有固有的模糊性,可能并不总是与这些情况下所需的精度一致。
AI 需要信号和锚点,而不仅仅是原始数据,才能取得成功
对于 Glean,我们的词汇搜索功能也因数据的稳健性而脱颖而出。这种优势使我们能够不仅能够高精度地匹配查询,还可以在大量潜在匹配中个性化结果。Glean 采用的混合搜索方法结合了两全其美的优势,利用了词汇搜索的精确性和对向量搜索的细致理解——所有这些都由我们知识图谱中的信号和锚点提供的额外上下文和细微差别提供支持。
最重要的是,Glean 将 LLM 与我们专有的搜索界面联系起来的能力使我们能够更优雅地处理搜索和检索遗漏。与我们的搜索界面集成的 LLM 可以更有说服力地处理搜索和检索遗漏。例如,大多数第三方解决方案在面对他们无法充分回答的问题时,通常会提供不新鲜或不相关的不良信息。
然而,当涉及到 Glean 时,LLM 获得了他们需要的额外背景信息,以澄清警告和预防措施。这些额外的信息使 AI 能够为员工提供他们所需的额外信息,以便他们执行后续步骤,或者更好地了解他们收到的信息可能不完整的原因。
Glean 的知识图谱为已弃用的结果提供了额外的上下文
如果您希望通过利用生成式 AI 的潜力在现在和今天保持领先地位,Glean 是最好的方式。Glean 始终具有权限感知能力、相关和个性化、新鲜和最新,并且普遍适用于您最常用的应用程序。
使用真正企业级的生成式 AI 解决方案提高团队的工作效率。
企业智能知识库企业Glean利用GraphRAG融资2.6亿美元
重磅 - 微软官宣正式在GitHub开源GraphRAG
开源GraphRAG解读:微软的人工智能驱动知识发现方法
GraphRAG工程落地成本详细解读和实例分析
GraphRAG类型、限制、案例、使用场景详细解析
引入GraphRAG的场景条件分析
不适用生成式人工智能的场景
知识图谱增强大模型GraphRAG全面综述解读 - 蚂蚁集团、北大、浙大、人大等
5个知识图谱KG和RAG系统的误解 — 构建和使用RAG原生图谱
OpenKG-SIG | SIGData兴趣组:利用大模型构建LLM需要的知识图谱
关于大模型和知识图谱、本体的一场讨论
什么时候(不)用GraphRAG
GraphRAG工程落地成本详细解读和实例分析
Structured-GraphRAG知识增强框架——足球游戏数据案例研究
StructRAG: 下一代GraphRAG - 中科院&阿里
KG RAG vs. Vector RAG:基准测试、优化杠杆和财务分析示例 - WhyHow.AI实践
WhyHow AI
知识图谱增强RAG流水线Use Case-WhyHow.AI
“大模型+知识图谱”双轮驱动的医药数智化转型新范式-OpenKG TOC专家谈
知识图谱(KG)和大模型(LLMs)双轮驱动的企业级AI平台构建之道暨行业调研
文章来自于微信公众号“知识图谱科技”,作者“ KGGPT”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner