从无相机位姿的图像实现同步三维重建与场景理解的方法及装置

申请号：CN202510910221

申请日期：2025-07-02

公开号：CN120807789A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开一种从无相机位姿的图像实现同步三维重建与场景理解的方法及装置，该方法通过给定一组稀疏的无相机位姿的多视角图像及其对应的相机内参，构建并训练同步三维重建与场景理解模型，该模型包括图像编码器、高斯解码器、统一查询解码器、几何引导的多视角掩码聚合模块、二维到三维语义映射模块；并利用训练后的同步三维重建与场景理解模型输出的辐射场进行在线的同步三维重建与场景理解。本发明无需特征对齐的范式和统一的任务建模，能够支持三维场景重建、三维语义/实例/全景/文本引用的场景理解等多重下游任务，且采用本发明进行三维场景重建的视觉质量高，三维场景理解更精确。

技术关键词

场景图像编码器多视角相机文本编码器解码器语义特征实例分割像素参数模块索引可读存储介质变换器视觉在线

系统为您推荐了相关专利信息

根据语音环境实现定向透传的方法、装置及语音交互设备

语音交互设备人声麦克风阵列波束成形技术状态检测单元

基于微调大语言模型的心理咨询模拟方法及系统

大语言模型文本摘要场景非暂态计算机可读存储介质

一种燃机安全生产智能管控系统

智能管控系统激光扫描探测器红外对射模块脉冲电子围栏视频分析

数据处理的路由决策方法、装置、设备及介质

决策方法标识策略语句标签

基于时空分离异构场景模型的流程合规判别方法及装置

判别方法异构检测连续视频帧场景信息编码