AI资讯新闻榜单内容搜索-计算机视觉

刚刚，李飞飞主讲的斯坦福经典CV课「2025 CS231n」免费可看了

就在刚刚，斯坦福大学经典 CV 课程 ——《CS231n：深度学习与计算机视觉》（2025 春季）正式上线了！课程网站：https://cs231n.stanford.edu/该系列课程深入探讨了深度学习架构的细节，并重点关注围绕图像分类、定位和检测等视觉识别任务的端到端模型学习，尤其是图像分类领域。

来自主题: AI资讯

10868 点击 2025-09-05 11:40

4D空间智能：AI如何一步步「看懂」时空结构？一篇综述解析通往四维世界的五大层次

4D 空间智能重建是计算机视觉领域的核心挑战，其目标在于从视觉数据中还原三维空间的动态演化过程。这一技术通过整合静态场景结构与时空动态变化，构建出具有时间维度的空间表征系统，在虚拟现实、数字孪生和智能交互等领域展现出关键价值。

来自主题: AI技术研报

8980 点击 2025-08-12 11:42

全球首个亚洲人脸超大规模数据集发布：让AI终于“认识”亚洲面孔

近日，ICCV 2025（国际计算机视觉大会）公布论文录用结果，理想汽车共有 8 篇论文入选，其中 3 篇来自基座模型团队。

来自主题: AI技术研报

9248 点击 2025-07-17 12:12

大模型时代，通用视觉模型将何去何从？

过去几年，通用视觉模型（Vision Generalist Model，简称 VGM）曾是计算机视觉领域的研究热点。

来自主题: AI技术研报

10008 点击 2025-07-02 10:52

UofT、UBC、MIT和复旦等联合发布：扩散模型驱动的异常检测与生成全面综述

扩散模型（Diffusion Models, DMs）近年来展现出巨大的潜力，在计算机视觉和自然语言处理等诸多任务中取得了显著进展，而异常检测（Anomaly Detection, AD）作为人工智能领域的关键研究任务，在工业制造、金融风控、医疗诊断等众多实际场景中发挥着重要作用。

来自主题: AI资讯

7410 点击 2025-07-01 10:55

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

在日常生活中，我们常通过语言描述寻找特定物体：“穿蓝衬衫的人”“桌子左边的杯子”。如何让 AI 精准理解这类指令并定位目标，一直是计算机视觉的核心挑战。

来自主题: AI技术研报

9305 点击 2025-07-01 10:11

速递｜Buildots完成4500万美元D轮融资，用AI模型+计算机视觉破解建筑业“信息脱节”难题

在建筑行业中，管理人员很容易与现场实际情况脱节。他们需要同时处理多项任务，包括掌握成本动态、与所有利益相关方沟通，以及评估与承包商账单和绩效等方面相关的风险。

来自主题: AI资讯

8880 点击 2025-05-30 20:11

港大马毅谈智能史：DNA 是最早的大模型，智能的本质是减熵

而马毅是那类觉得不够的人，他于无声处开始提问：智能的本质是什么？自 2000 年从伯克利大学博士毕业以来，马毅先后任职于伊利诺伊大学香槟分校（UIUC）、微软亚研院、上海科技大学、伯克利大学和香港大学，现担任香港大学计算与数据科学学院院长。他和团队提出的压缩感知技术，到现在还在影响计算机视觉中模式识别领域的发展。

来自主题: AI技术研报

10883 点击 2025-05-25 12:43

CVPR 2025 Oral | DiffFNO：傅里叶神经算子助力扩散，开启任意尺度超分辨率新篇章

从单张低分辨率（LR）图像恢复出高分辨率（HR）图像 —— 即 “超分辨率”（SR）—— 已成为计算机视觉领域的重要挑战。

来自主题: AI技术研报

9175 点击 2025-05-04 17:21

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而，机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。

来自主题: AI技术研报

8816 点击 2025-04-09 08:59