摘要
本发明涉及化工企业知识库构建方法、装置、电子设备及存储介质,该方法包括:获取化工企业的文档数据集合,并将文档数据集合整理为独立的知识单元。通过大语言模型的嵌入机制将每个文档数据映射至高维向量空间,以生成嵌入向量,并基于嵌入向量及其对应的文档标识存储至向量数据库中。调用嵌入函数将用户输入的自然语言查询文本转化为高维查询向量,并通过向量相似性度量计算高维查询向量与向量数据库中每个嵌入向量之间的相似性得分,以选取相似性得分超过第一阈值的关联文档数据。将自然语言查询文本和关联文档数据的上下文拼接为RAG生成模型的输入,通过大语言模型生成答案,并基于生成的答案结合关联文档数据构建知识库。