AI资讯新闻榜单内容搜索-ICCV

ICCV 2025 | 浙大、港中文等提出EgoAgent：第一人称感知-行动-预测一体化智能体

在今年的国际计算机视觉大会（ICCV 2025）上，来自浙江大学、香港中文大学、上海交通大学和上海人工智能实验室的研究人员联合提出了第一人称联合预测智能体 EgoAgent。

来自主题: AI技术研报

8215 点击 2025-10-18 11:48

ICCV 2025 | FDAM：告别模糊视界，源自电路理论的即插即用方法让视觉Transformer重获高清细节

针对视觉 Transformer（ViT）因其固有 “低通滤波” 特性导致深度网络中细节信息丢失的问题，我们提出了一种即插即用、受电路理论启发的频率动态注意力调制（FDAM）模块。它通过巧妙地 “反转” 注意力以生成高频补偿，并对特征频谱进行动态缩放，最终在几乎不增加计算成本的情况下，大幅提升了模型在分割、检测等密集预测任务上的性能，并取得了 SOTA 效果。

来自主题: AI技术研报

7519 点击 2025-10-16 14:35

ICCV 25 Highlight | 扩散过程「早预警」实现6x加速，AIGC生图的高效后门防御

随着 AIGC 图像生成技术的流行，后门攻击给开源社区的繁荣带来严重威胁，然而传统分类模型的后门防御技术无法适配 AIGC 图像生成。

来自主题: AI技术研报

8913 点击 2025-09-25 15:02

AI在实时视频里秒“剪”出你想要的部分！输入文字/图/视频片段，它都能秒懂｜ICCV2025

还在实时视频里找特定事件找半天？最新技术直接开挂了。

来自主题: AI技术研报

7817 点击 2025-09-18 15:23

ICCV 2025 | 基于时序增强关系敏感知识迁移的弱监督动态场景图生成

本文主要介绍来自该团队的最新论文：TRKT，该任务针对弱监督动态场景图任务展开研究，发现目前的性能瓶颈在场景中目标检测的质量，因为外部预训练的目标检测器在需要考虑关系信息和时序上下文的场景图视频数据上检测结果欠佳。

来自主题: AI技术研报

8257 点击 2025-09-05 11:18

ICCV 2025 Highlight | 3D真值生成新范式，开放驾驶场景的语义Occupancy自动化标注!

本文介绍了来自北京大学王选计算机研究所王勇涛团队及合作者的最新研究成果 AutoOcc。针对开放自动驾驶场景，该篇工作提出了一个高效、高质量的 Open-ended 三维语义占据栅格真值标注框架，无需任何人类标注即可超越现有语义占据栅格自动化标注和预测管线，并展现优秀的通用性和泛化能力，论文已被 ICCV 2025 录用为 Highlight。

来自主题: AI技术研报

8475 点击 2025-08-29 11:42