摘要
本发明涉及大语言模型技术领域,具体为一种针对结构化长文档的问答方法,包括以下步骤:S1、解析不同格式的文档,根据解析结果构建文档的结构化元数据;S2、将文档划分成多个文本片段,对每个文本片段进行向量化处理,并存储在专用的向量数据库中;S3、分别构建多个文本内容获取工具,用于提取文档中不同部分的文本内容;设计并实现基于向量的检索工具,用于在向量数据库中查找与用户查询相关的文本片段;S4、构建包含多个文本内容获取工具和检索工具的Agent,针对用户问题智能选择文本内容获取工具或检索工具以获取LLM回答问题所需要的相关文本内容;S5、在获取相关文本内容后,通过LLM通过对相关文本内容进行分析,生成最终回答。