看遍奥斯卡后,VLM达到电影摄影理解新SOTA|上海AI Lab开源 看遍奥斯卡后,VLM达到电影摄影理解新SOTA|上海AI Lab开源 关键词: AI,模型训练,ShotBench,人工智能 当前最强大的视觉语言模型(VLMs)虽然能“看图识物”,但在理解电影方面还不够“聪明”。 来自主题: AI技术研报 8111 点击 2025-07-17 10:19