
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
来自主题: AI技术研报
6732 点击 2025-05-03 15:24
超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
在当前内卷严重的实时目标检测 (Real-time Object Detection) 领域,性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略,导致性能逐渐趋于饱和。
相同性能情况下,延迟减少 46%,参数减少 25%。
距离YOLOv8发布仅1年的时间,v9诞生了!
继 2023 年 1 月 YOLOv8 正式发布一年多以后,YOLOv9 终于来了!