
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。
Stable Diffusion 3,它终于来了!
今日份炸弹又来了!深夜,Stability AI放出了Stable Diffusion 3.0,它采用了和爆火Sora同样的DiT架构,画面质量、文字渲染、复杂对象理解大提升,Midjourney、DALL-E 3都显得黯然失色了。
Sora表现强大的3点关键原因,以及我们作为普通人,应该如何面对新技术带来的冲击?
Stable Diffusion是一个生成式AI模型,简单点来说就是一个会画画的AI,当你输入一个关键词后,它就能创作出一个相关的图像。
绝大多数AI生图模型在训练的时候侧重的是文本和图形之间的关联,并不擅长语义分析和复杂元素处理。
Stable Diffusion要王者归来了?
在过去短短两年内,随着诸如 LAION-5B 等大规模图文数据集的开放,Stable Diffusion、DALL-E 2、ControlNet、Composer ,效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。
2023 淘宝年终大促,有了 AIGC 开路助力。
来自香港大学、阿里巴巴和蚂蚁集团的新成果 Anydoor 为图片编辑打开了一扇「任意门」。任何物品,只需要一张照片,就能被传送到另一张图片的世界中。