Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积 关键词: 扩散模型,ViT,Transformer,CNN,计算机视觉 用卷积能做出一样好的效果。 来自主题: AI资讯 8059 点击 2024-06-01 18:57
字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024 关键词: ViTamin,视觉基础模型,SOTA,Transformer,模型训练 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 来自主题: AI技术研报 4314 点击 2024-04-27 12:15
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果” 关键词: 生数科技,多模态大模型,多模态,清华多模态,U-ViT 清华系多模态大模型公司,又拿钱了! 来自主题: AI资讯 5262 点击 2024-03-12 18:17
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA 关键词: VisionLLAMA,ViT,LLaMA,模型训练 半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 来自主题: AI技术研报 3629 点击 2024-03-07 14:01