AI资讯新闻榜单内容搜索-计算机视觉

专访Reverie袁博地：从Google X到实时交互模型，重新定义下一代AI Interface

袁博地的答案是否定的。从清华大学接触计算机视觉，到 UC Berkeley 攻读 AI 博士，再到 Google X 负责机器人的视觉系统，袁博地过去十多年的研究几乎始终围绕 Pixel 展开：从图像识别，到 GAN、Diffusion，再到图像和视频生成，技术范式不断变化，研究对象却始终指向同一件事——如何让机器理解和生成视觉世界。

来自主题: AI资讯

8733 点击 2026-07-22 15:47

世界模型评测的最大盲区，被新基准MemoBench捅破了

来自哈佛大学、MIT、IBM、波士顿大学、谷歌、JHU、CMU 和 Kempner Institute 的研究者提出了一个新的诊断性基准：MemoBench。这是首个面向动态环境的「消失-重现」世界建模评测基准，并已被计算机视觉顶会 ECCV 2026 接收。其一作 Haoyu Chen 为哈佛大学计算科学与工程专业一年级硕士生，师从哈佛大学计算机科学助理教授 Yilun Du。

来自主题: AI技术研报

7922 点击 2026-07-06 12:24

Z Potentials｜CVPR 现场对话苏度科技团队：没有遥控器，没有隔离带，只有真实世界随机的考卷

2026 年 6 月的科罗拉多州丹佛市，全球计算机视觉与模式识别领域的顶级学术盛会 CVPR 正在召开，最前沿的视觉模型、机器人技术、下一代智能系统全都在同一个舞台上被反复讨论和辩证。

来自主题: AI资讯

10015 点击 2026-06-08 09:48

CVPR 2026｜LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

近日，来自清华大学智能产业研究院（AIR）的团队联合北京智源研究院（BAAI）、北京大学、南京大学等机构构建了一个基准：GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark，

来自主题: AI技术研报

9653 点击 2026-06-07 10:54

Z Potentials｜对话Dyna Robotics联创York Yang：把机器人想象成大模型的下一站，是对具身智能最大的误解

连续创业的 York 开启了又一段新征程。过去十几年里，他几乎一直在做软硬一体系统：从计算机视觉、嵌入式，到后来的机器人。他的上一个创业项目——智能购物车 Caper AI，在 2021 年被 Instacart 以 3.5 亿美元收购。

来自主题: AI资讯

9694 点击 2026-06-01 13:56

CVPR 2026 Oral | 清华+阿里发布ViT³：解锁「视觉TTT」新架构，突破Transformer复杂度瓶颈

序列建模是大语言模型、计算机视觉等领域的基础共性问题。当前通用的 Transformer 模型计算复杂度随序列长度平方增长，在长序列任务中面临显著的计算挑战。因此，研究者们一直在探索具有线性计算复杂度的高效序列建模方法。

来自主题: AI技术研报

6180 点击 2026-05-18 15:30

库里被「采访」、杨紫被「演」短剧？别慌！蚂蚁AI鉴真拿下CVPR 2026冠军，专治黑产

最近，计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛（ Robust AI-Generated Image Detection in the Wild Challenge ）结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723，成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。

来自主题: AI技术研报

10440 点击 2026-04-10 15:57