Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新的高度。
Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新的高度。
Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内一众大佬的8000万美元融资,文生图这条离钱最近的AI赛道又加入了一名重量级选手。
从文本生成模型 GPT、文生图模型 DALL·E,到文生视频模型 Sora,OpenAI 可以说成功跑通了 AGI 的所有技术栈,为什么是 OpenAI 而不是谷歌、Meta?
现在世界上最受关注的技术团队是哪一支?Sora团队,已经来到聚光灯中心。
动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。
据彭博社消息,奥特曼再次为一家人工智能芯片企业筹集数十亿美元。目的是利用这笔资金开发一个“工厂网络”(network of factories),用于制造,该网络将延伸到全球,并涉及与未透露名字的“顶级芯片制造商”合作。
AI绘图作为跟大语言模型并驾齐驱的最成熟的模态之一。
在过去短短两年内,随着诸如 LAION-5B 等大规模图文数据集的开放,Stable Diffusion、DALL-E 2、ControlNet、Composer ,效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。
微软发福利,DALL-E 3可以和手机键盘绑定了!键盘区秒变生图区,在任何APP中都能使用。
和ChatGPT一样,现在的微软Copilot也拥有自己的专属网站。 但与之不同的是,像GPT-4、DALL·E 3这样的功能,在Copilot上统统都是免费的!