
首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频
首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频最近,新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架,这也是首次大模型推理社区提出的面向视频的思维链框架(Video-of-Thought, VoT)。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。
来自主题: AI技术研报
9710 点击 2024-07-12 17:54