从无相机位姿的图像实现同步三维重建与场景理解的方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
从无相机位姿的图像实现同步三维重建与场景理解的方法及装置
申请号:CN202510910221
申请日期:2025-07-02
公开号:CN120807789A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开一种从无相机位姿的图像实现同步三维重建与场景理解的方法及装置,该方法通过给定一组稀疏的无相机位姿的多视角图像及其对应的相机内参,构建并训练同步三维重建与场景理解模型,该模型包括图像编码器、高斯解码器、统一查询解码器、几何引导的多视角掩码聚合模块、二维到三维语义映射模块;并利用训练后的同步三维重建与场景理解模型输出的辐射场进行在线的同步三维重建与场景理解。本发明无需特征对齐的范式和统一的任务建模,能够支持三维场景重建、三维语义/实例/全景/文本引用的场景理解等多重下游任务,且采用本发明进行三维场景重建的视觉质量高,三维场景理解更精确。
技术关键词
场景 图像编码器 多视角 相机 文本编码器 解码器 语义特征 实例分割 像素 参数 模块 索引 可读存储介质 变换器 视觉 在线
系统为您推荐了相关专利信息
语音交互设备 人声 麦克风阵列 波束成形技术 状态检测单元
大语言模型 文本 摘要 场景 非暂态计算机可读存储介质
智能管控系统 激光扫描探测器 红外对射模块 脉冲电子围栏 视频分析
决策方法 标识 策略 语句 标签
判别方法 异构 检测连续视频帧 场景 信息编码