
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。
来自主题: AI技术研报
7109 点击 2024-04-22 17:42
近年来,多模态大型语言模型(MLLM)在各个领域的应用取得了显著的成功。然而,作为许多下游任务的基础模型,当前的 MLLM 由众所周知的 Transformer 网络构成,这种网络具有较低效的二次计算复杂度。