摘要
本发明公开了一种基于深度学习的多模态数据质量评估方法,包括获取数据库中被标记为对齐的第一模态记录数据和第二模态记录数据;对第一模态记录数据和第二模态记录数据分别进行语义特征提取以得到文本结构化数据语义编码特征张量和元数据描述语义编码特征向量;对文本结构化数据语义编码特征张量和元数据描述语义编码特征向量跨模态联合编码以得到结构化‑元数据跨模态质量评估联合编码特征张量;基于结构化‑元数据跨模态质量评估联合编码特征张量生成重构记录数据,计算重构记录数据的偏移特征;通过第一深度学习模型对偏移特征进行质量评估;本发明通过语义编码特征提取、细粒度哈希跨模态编码与双向重构偏移评估,提高数据质量评估的精准性。