
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。
来自主题: AI技术研报
5273 点击 2024-01-30 13:36
动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。
在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。
日前快手方面宣布,开始在短视频评论区测试基于自研大模型图像生成能力打造的 AI 文生图功能 " 快手 AI 玩评 "。