ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3 关键词: LaVIT,ICLR 2024,DALLE-3,多模态模型 动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。 来自主题: AI技术研报 4836 点击 2024-01-30 13:36