
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了
来自主题: AI技术研报
7776 点击 2024-04-14 15:01
新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了
一款名为Vary-toy的“年轻人的第一个多模态大模型”来了!模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡轻松运行。
想将一份文档图片转换成Markdown格式?这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: