一种针对结构化长文档的问答方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种针对结构化长文档的问答方法及系统
申请号:CN202510336343
申请日期:2025-03-21
公开号:CN119848223B
公开日期:2025-07-22
类型:发明专利
摘要
本发明涉及大语言模型技术领域,具体为一种针对结构化长文档的问答方法,包括以下步骤:S1、解析不同格式的文档,根据解析结果构建文档的结构化元数据;S2、将文档划分成多个文本片段,对每个文本片段进行向量化处理,并存储在专用的向量数据库中;S3、分别构建多个文本内容获取工具,用于提取文档中不同部分的文本内容;设计并实现基于向量的检索工具,用于在向量数据库中查找与用户查询相关的文本片段;S4、构建包含多个文本内容获取工具和检索工具的Agent,针对用户问题智能选择文本内容获取工具或检索工具以获取LLM回答问题所需要的相关文本内容;S5、在获取相关文本内容后,通过LLM通过对相关文本内容进行分析,生成最终回答。
技术关键词
文本 问答方法 表格 页面 语义 图像 格式 生成答案 大语言模型 问答系统 标识 框架 层级 数据 表头 序列 定义 字体 样式