让视觉语言模型搞空间推理,谷歌又整新活了 让视觉语言模型搞空间推理,谷歌又整新活了 关键词: SpatialVLM,语言模型,空间推理,模型训练 视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。 来自主题: AI技术研报 7732 点击 2024-02-18 15:10