AI资讯新闻榜单内容搜索-CV

无需NeRF/高斯点后处理，视频秒变游戏模型成现实！新方法平均每帧仅需60秒 | ICCV 2025

只需一段视频，就可以直接生成可用的4D网格动画？！来自KAUST的研究团队提出全新方法V2M4，能够实现从单目视频直接生成高质量、显式的4D网格动画资源。

来自主题: AI技术研报

5431 点击 2025-07-20 11:21

真实物理加持，人物动画再也不像塑料人！UIUC华人让角色活起来了 | ICCV'25

PhysRig是UIUC与Stability AI联合提出的首个面向角色动画的可微物理绑定框架。通过将刚性骨架嵌入弹性软体体积，并使用Material Point Method（MPM）进行可微分物理模拟，PhysRig能够自然还原皮肤、脂肪、尾巴等柔性结构的变形过程，显著提升角色动画的真实感，解决传统LBS无法克服的体积丢失与变形伪影问题。

来自主题: AI技术研报

5879 点击 2025-07-20 11:13

突破户外RGB-only SLAM尺度漂移难题，精确定位+高保真重建 | ICCV'25开源

户外SLAM的尺度漂移问题，终于有了新解法！香港科技大学（广州）的研究的最新成果：S3PO-GS，一个专门针对户外单目SLAM的3D高斯框架，已被ICCV 2025接收。

来自主题: AI技术研报

5888 点击 2025-07-19 10:59

ICCV 2025｜训练太复杂？对图片语义、布局要求太高？图像morphing终于一步到位

本文第一作者操雨康，南洋理工大学MMLab博士后，研究方向是3D/4D重建与生成，人体动作/视频生成，以及图像生成与编辑。

来自主题: AI技术研报

7201 点击 2025-07-18 11:12

全球首个亚洲人脸超大规模数据集发布：让AI终于“认识”亚洲面孔

近日，ICCV 2025（国际计算机视觉大会）公布论文录用结果，理想汽车共有 8 篇论文入选，其中 3 篇来自基座模型团队。

来自主题: AI技术研报

6569 点击 2025-07-17 12:12

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制：仅5%注意力头负责多模态视觉理解

多模态大模型通常是在大型预训练语言模型（LLM）的基础上扩展而来。尽管原始的 LLM 并不具备视觉理解能力，但经过多模态训练后，这些模型却能在各类视觉相关任务中展现出强大的表现。

来自主题: AI技术研报

5877 点击 2025-07-15 10:07

密室逃脱成AI新考场，通关率不足50%，暴露空间推理短板丨清华ICCV25

近年来，多模态大模型（MLLMs）发展迅猛，从看图说话到视频理解，似乎无所不能。

来自主题: AI资讯

6591 点击 2025-07-13 11:53

ICCV2025 | 多视图生成新范式-利用自回归模型探索多视图生成

本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中，模型能够从所有先前的视图中提取有效的引导信息，从而增强多视图的一致性。

来自主题: AI技术研报

5981 点击 2025-07-13 11:07

ICCV 2025 | UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

来自加州大学河滨分校（UC Riverside）、密歇根大学（University of Michigan）、威斯康星大学麦迪逊分校（University of Wisconsin–Madison）、德州农工大学（Texas A&M University）的团队在 ICCV 2025 发表首个面向自动驾驶语义占用栅格构造或预测任务的统一基准框架 UniOcc。

来自主题: AI技术研报

7229 点击 2025-07-10 10:39

两张图就能重构3D空间？清华&NTU利用生成模型解锁空间智能新范式

最少只用2张图，AI就能像人类一样理解3D空间了。ICCV 2025最新中稿的LangScene-X：以全新的生成式框架，仅用稀疏视图（最少只用2张图像）就能构建可泛化的3D语言嵌入场景，对比传统方法如NeRF，通常需要20个视角。

来自主题: AI技术研报

6356 点击 2025-07-09 11:08