
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术视频理解因大量时空冗余和复杂时空依赖,同时克服两个问题难度巨大,CNN 和 Transformer 及 Uniformer 都难以胜任,Mamba 是个好思路,让我们看看本文是如何创造视频理解的 VideoMamba。
来自主题: AI资讯
6097 点击 2024-03-24 21:44
视频理解因大量时空冗余和复杂时空依赖,同时克服两个问题难度巨大,CNN 和 Transformer 及 Uniformer 都难以胜任,Mamba 是个好思路,让我们看看本文是如何创造视频理解的 VideoMamba。