摘要
本申请提出一种基于概率化三维高斯的场景语义占有预测方法,包括:使用二维主干网络处理多视角相机图像,生成多视角多尺度的图像特征,并由图像特征预测与像素对齐的三维占用分布,根据该分布初始化三维高斯的位置属性;将三维高斯视为点云数据,通过体素化生成稀疏体素数据,利用三维稀疏卷积对稀疏体素数据进行处理,完成三维高斯间的特征交互;通过使用交叉注意力机制,由图像特征更新三维高斯的特征;使用高斯属性微调模型对三维高斯的特征中的各属性进行逐层迭代优化;使用概率高斯叠加方法聚合三维高斯的几何属性与语义属性,生成场景的三维语义占用预测结果。本申请能够解决自动驾驶场景的高效自适应三维语义占有预测问题。