摘要
本发明公开了单目视频4D人体与场景实时三维重建方法及系统,包括如下步骤:S1、获取视频流并进行预处理;S2、视觉Transformer执行单目深度估计,时空图网络进行人体姿态估计;S3、改进鲸鱼优化算法进行全局搜索,飞蛾火焰优化算法进行局部搜索;S4、联合更新深度估计网络与人体姿态估计网络参数;S5、数据融合生成初步4D人体与场景三维重建模型;S6、时序建模及自适应时空一致性校正;S7、输出优化后的4D人体与场景三维重建模型。本发明通过单目视频数据,实现4D人体与场景的高精度实时三维重建,提升重建精度、时空连续性和计算效率,广泛适用于智能监控、虚拟现实和运动分析等领域。