摘要
本发明公开了一种多模态数据集的构建方法及系统,所述多模态数据集包括结构化数据和非结构化数据,该方法包括:对非结构化数据进行离线处理及融合,生成结构化知识图谱;对结构化数据进行离线映射处理,将离线处理后的非结构化数据和离线映射处理后的结构化数据同时输入到预设的结构化模型中,生成数据库;结合结构化知识图谱和数据库,构建离线模型并训练,以得到目标大语言模型;在线获取并分析用户需求,制订分析计划,利用目标大语言模型执行分析计划,生成多模态数据集并向用户输出。该方法支持多模态数据融合分析,具备大规模实时数据处理能力,能高效应对动态数据的处理与更新需求。