摘要
本发明公开的多源异构数据语义对齐方法、装置、设备及介质,通过获取多源异构数据,并对所述多源异构数据进行预处理获得标准化数据单元集合;根据所述标准化数据单元集合结合对比学习构建样本对,对所述样本对间的距离进行训练优化,识别单元语义特征中的数据一致性,输出一致性标签;对所述标准化数据单元集合的每个单元进行无监督特征提取,获得单元潜在语义特征;基于所述一致性标签和所述单元潜在语义特征对所述多源异构数据进行语义对齐,构建语义空间。本申请方案能够实现多源异构数据的语义标准化对齐,确保设备多源异构数据在知识图谱中准确映射与融合。