北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源 关键词: Video-LLaVA,视觉语言大模型,北大开源视觉大模型,LLM AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。 来自主题: AI技术研报 4685 点击 2023-11-21 12:24