AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight
AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight多模态视频异常理解任务,又有新突破!
来自主题: AI技术研报
8876 点击 2025-04-08 15:01
多模态视频异常理解任务,又有新突破!
近年来,人物动作生成的研究取得了显著的进展,在众多领域,如计算机视觉、计算机图形学、机器人技术以及人机交互等方面获得广泛的关注。然而,现有工作大多只关注动作本身,以场景和动作类别同时作为约束条件的研究依然处于起步阶段。
本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting(三维语义高斯泼溅)。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上,查询速度比之前的SOTA方法LERF快了199倍。代码已开源。
入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果,查询速度比之前的SOTA方法LERF快了199倍!
拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!
传统的 3D 重建算法需要不同视角拍摄的多张图片作为输入从而重建出 3D 场景。近年来,有相当多的工作尝试从单张图片构建 3D 场景。然而,绝大多数此类工作都依赖生成式模型(如 Stable Diffusion),换句话说,此类工作仍然需要通过预训练的生成式模型推理场景中的 3D 信息。