AI资讯新闻榜单内容搜索-目标检测

NeurIPS 2024 | 无需训练，一个框架搞定开放式目标检测、实例分割

本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景，该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM，在无需训练的情况下，取得了良好的开放式 (Open-ended) 目标检测和实例分割结果，论文已被 NeurIPS 2024 录用。

来自主题: AI技术研报

4765 点击 2024-11-16 15:21

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

在当前内卷严重的实时目标检测 (Real-time Object Detection) 领域，性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略，导致性能逐渐趋于饱和。

来自主题: AI技术研报

11606 点击 2024-10-29 13:30

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

西安电子科大、上海AI Lab等提出多模态融合检测算法E2E-MFD，将图像融合和目标检测整合到一个单阶段、端到端框架中，简化训练的同时，提升目标解析性能。相关论文已入选顶会NeurlPS 2024 Oral，代码、模型均已开源。

来自主题: AI技术研报

6006 点击 2024-10-25 10:56

目标检测新SOTA，端侧实时识别，沈向洋罕见转发点赞

目标检测领域，迎来了新进展—— Grounding DINO 1.5，IDEA研究院团队出品，在端侧就可实现实时识别。

来自主题: AI资讯

11695 点击 2024-05-27 16:47

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

近年来，「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用，通过大规模训练得到的视觉基础网络（如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等）已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。

来自主题: AI技术研报

10837 点击 2024-05-22 13:33

YOLOv9来了：实时目标检测新SOTA，完胜各种轻量或大型模型！出自v7作者

距离YOLOv8发布仅1年的时间，v9诞生了！

来自主题: AI技术研报

6380 点击 2024-02-24 11:53

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！

来自主题: AI技术研报

8524 点击 2024-02-23 14:42