摘要
本发明基于图像融合与深度学习的建筑物高度估计方法,首先进行多元图像融合,通过Laplace金字塔分层融合策略,在保留光学影像高频纹理细节的同时,深度融合SAR数据的低频结构特征;并制作数据集。随后基于编码器解码器与视觉变压器的深度学习模型,搭建深度学习模型;通过深度学习模型实现局部细节感知与全局语义建模的深度融合,编码器从四波段融合影像中提取多尺度空间‑光谱特征,局部分支通过3×3卷积强化建筑边缘等细粒度特征,而全局分支利用ViT编码器建模大范围建筑群高度分布规律。通过设计的范围注意力图(A)动态耦合局部特征与全局上下文,并基于单元高度概率张量建立像素级高度概率分布模型,有效解决了建筑物高度估计中的长尾分布问题。