摘要
本发明公开了一种基于上下文感知的检索增强生成方法及系统,涉及信息检索技术领域,方法包括:对知识库文档进行分块处理,并分配唯一标识符及排序序号,建立文本块之间的关联关系以保存文档结构;构建文档的结构索引;根据用户的查询请求,基于向量相似度对查询内容进行初始检索,获得相关度最高的初始相关文本块集合;对初始相关文本块集合进行上下文扩展检索,获得扩展的前后文文本块集合;对前后文文本块集合进行去重、合并和重新排序处理,采用平滑过渡技术得到自然文本作为检索结果。通过本发明的技术方案,既保证相关性又保证上下文完整性,能够有效解决传统RAG系统的语义碎片化问题,显著提高了检索质量。