
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。
来自主题: AI资讯
6087 点击 2023-11-29 15:32
训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。