无损加速视觉语言模型推理!轻松剪掉视觉冗余Token|腾讯AI Lab 无损加速视觉语言模型推理!轻松剪掉视觉冗余Token|腾讯AI Lab 关键词: AI,模型训练,VScan,人工智能 多图像、长视频、细粒度感知正在让大型视觉语言模型(LVLM)变得越来越聪明,但也越来越“吃不消”:视觉Token数量的激增所带来的推理成本暴涨,正逐渐成为多模态智能扩展的最大算力瓶颈。 来自主题: AI技术研报 5940 点击 2025-07-05 19:00