摘要
本发明涉及人工智能技术领域,提供了一种基于跨模态注意力蒸馏的图像相似度计算方法及装置,方法包括:对训练图像进行转换并提取得到编码向量,通过注意力对齐网络对嵌入向量与多模态特征对应的多模态注意力信息并进行融合得到注意力融合信息,根据注意力融合信息对视觉特征提取模型进行迭代优化,得到基于注意力蒸馏优化的目标视觉特征提取模型后,分别提取初始图像及目标对比图像的向量并计算图像相似度。本发明可应用于金融科技、医疗健康、养老等业务领域的图像处理系统中,进行图像相似性分析时,通过跨模态注意力对齐解决不同模态注意力之间的结构差异性,通过注意力蒸馏优化对模型进行迭代优化,提高了模型训练效率及相似度分析的准确性。