AI资讯新闻榜单内容搜索-计算机视觉

UofT、UBC、MIT和复旦等联合发布：扩散模型驱动的异常检测与生成全面综述

扩散模型（Diffusion Models, DMs）近年来展现出巨大的潜力，在计算机视觉和自然语言处理等诸多任务中取得了显著进展，而异常检测（Anomaly Detection, AD）作为人工智能领域的关键研究任务，在工业制造、金融风控、医疗诊断等众多实际场景中发挥着重要作用。

来自主题: AI资讯

7936 点击 2025-07-01 10:55

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

在日常生活中，我们常通过语言描述寻找特定物体：“穿蓝衬衫的人”“桌子左边的杯子”。如何让 AI 精准理解这类指令并定位目标，一直是计算机视觉的核心挑战。

来自主题: AI技术研报

9747 点击 2025-07-01 10:11

速递｜Buildots完成4500万美元D轮融资，用AI模型+计算机视觉破解建筑业“信息脱节”难题

在建筑行业中，管理人员很容易与现场实际情况脱节。他们需要同时处理多项任务，包括掌握成本动态、与所有利益相关方沟通，以及评估与承包商账单和绩效等方面相关的风险。

来自主题: AI资讯

9342 点击 2025-05-30 20:11

港大马毅谈智能史：DNA 是最早的大模型，智能的本质是减熵

而马毅是那类觉得不够的人，他于无声处开始提问：智能的本质是什么？自 2000 年从伯克利大学博士毕业以来，马毅先后任职于伊利诺伊大学香槟分校（UIUC）、微软亚研院、上海科技大学、伯克利大学和香港大学，现担任香港大学计算与数据科学学院院长。他和团队提出的压缩感知技术，到现在还在影响计算机视觉中模式识别领域的发展。

来自主题: AI技术研报

11475 点击 2025-05-25 12:43

CVPR 2025 Oral | DiffFNO：傅里叶神经算子助力扩散，开启任意尺度超分辨率新篇章

从单张低分辨率（LR）图像恢复出高分辨率（HR）图像 —— 即 “超分辨率”（SR）—— 已成为计算机视觉领域的重要挑战。

来自主题: AI技术研报

9661 点击 2025-05-04 17:21

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而，机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。

来自主题: AI技术研报

9320 点击 2025-04-09 08:59

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

如何从一张普通的单幅图像准确估计物体的三维法线和材质属性，是计算机视觉与图形学领域长期关注的难题。

来自主题: AI技术研报

4460 点击 2025-04-03 10:11

Adobe黑科技：视频扩散降维图像编辑，ObjectMover秒懂物理规律

论文第一作者为余鑫，香港大学三年级博士生，通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用，发表计算机视觉和图形学顶级会议期刊论文数十篇，论文数次获得 Oral, Spotlight 和 Best Paper Honorable Mention 等荣誉。此项研究工作为作者于 Adobe Research 的实习期间完成。

来自主题: AI技术研报

10451 点击 2025-03-30 10:46

“计算机视觉被GPT-4o终结了”（狗头）

一夜之间，CV被大模型“解决”了（狗头）。万物皆可吉卜力之后，GPT-4o原生多模态图像生成更多玩法被开发出来。万物皆可吉卜力之后，GPT-4o原生多模态图像生成更多玩法被开发出来。

来自主题: AI资讯

8708 点击 2025-03-30 10:43

单张照片实现三维重建，单视角室外复杂场景首次攻克｜西湖大学&港科大&Everlyn AI

单视角三维场景重建一直是计算机视觉领域中的核心挑战之一，尤其在捕捉高保真室外场景细节时，如何确保结构一致性和几何精度显得尤为困难。

来自主题: AI技术研报

10129 点击 2025-03-21 10:40

AI资讯新闻榜单内容搜索-计算机视觉

UofT、UBC、MIT和复旦等联合发布：扩散模型驱动的异常检测与生成全面综述

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

速递｜Buildots完成4500万美元D轮融资，用AI模型+计算机视觉破解建筑业“信息脱节”难题

港大马毅谈智能史：DNA 是最早的大模型，智能的本质是减熵

CVPR 2025 Oral | DiffFNO：傅里叶神经算子助力扩散，开启任意尺度超分辨率新篇章

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

Adobe黑科技：视频扩散降维图像编辑，ObjectMover秒懂物理规律

“计算机视觉被GPT-4o终结了”（狗头）

单张照片实现三维重建，单视角室外复杂场景首次攻克｜ 西湖大学&港科大&Everlyn AI

单张照片实现三维重建，单视角室外复杂场景首次攻克｜西湖大学&港科大&Everlyn AI