北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。
来自主题: AI技术研报
5027 点击 2023-11-21 12:24
AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。