AI资讯新闻榜单内容搜索-生图

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

一转眼，2024 年已经过半。我们不难发现，AI 尤其是 AIGC 领域出现一个越来越明显的趋势：文生图赛道进入到了稳步推进、加速商业落地的阶段，但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待，对动态视频的创作需求前所未有的高涨。

来自主题: AI资讯

10621 点击 2024-07-06 18:56

Llama也能做图像生成！港大字节推出开源自回归文生图模型，在线体验已开放

只需Image Tokenizer，Llama也能做图像生成了，而且效果超过了扩散模型。

来自主题: AI资讯

10000 点击 2024-07-04 11:09

CVPR'24：文生图提示词自动优化，还发现三个小窍门，人大度小满等机构出品

文生图也有自己的prompt优化工具了。

来自主题: AI资讯

7308 点击 2024-07-02 18:03

300多篇相关研究，复旦、南洋理工最新多模态图像编辑综述论文

本文提出了解决一般性编辑任务的统一框架！近期，复旦大学 FVL 实验室和南洋理工大学的研究人员对于多模态引导的基于文生图大模型的图像编辑算法进行了总结和回顾。综述涵盖 300 多篇相关研究，调研的最新模型截止至今年 6 月！

来自主题: AI技术研报

8552 点击 2024-06-29 00:35

Glif 的作者五分钟做了个 AI 梗图生成器，结果风靡推特。

推特上有这么一个作者，今天早上只用了五分钟，使用了 Claude 3.5、ComfyUI、JSON 提取器等模块，搭建了个生成 meme 梗图的生成器，截止目前已经 157.3w 人看过。

来自主题: AI资讯

6735 点击 2024-06-27 17:37

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像，中科大哈工大度小满出品

超越扩散模型！自回归范式在图像生成领域再次被验证——

来自主题: AI技术研报

9634 点击 2024-06-26 18:21

AI生图可“量身定制”了，华为&清华联手打造个性化多模态生成方法PMG

苹果OpenAI官宣合作，GPT-4o加持Siri，让AI个性化生成赛道热度飙升。

来自主题: AI技术研报

9584 点击 2024-06-20 10:08

北大快手攻克复杂视频生成难题！新框架轻松组合各种细节，代码将开源

如何生成高难度、指令超复杂的视频呢？

来自主题: AI技术研报

9647 点击 2024-06-16 17:29

AI生图格局大震！Stable Diffusion 3开源倒计时，2B单机可跑碾压闭源Midjourney

重磅消息！Stable Diffusion 3，大概率会在明天开源。距离2月SD3的横空出世，已经过去了4个月。如果此事为真，生图圈子第一个出现开源碾压闭源的奇景！强大的MMDiT全新架构，将彻底改变AI生图的格局。现在，全体AI社区都在翘首以盼。

来自主题: AI资讯

9662 点击 2024-06-13 11:19

AI首先替代的不是蓝领白领工作？

OpenAI在5月14日推出了新一代人工智能模型GPT-4o，支持文本、音频和图像的任意组合输入，并能够生成文本、音频和图像的任意组合输出。仅仅一天后，谷歌就在新一届I/O开发者大会上发布、更新了十多款产品，包括AI助手Project Astra、文生图模型Imagen3、对标Sora的文生视频模型Veo，以及备受瞩目的大模型Gemini 1.5 Pro的升级版。

来自主题: AI资讯

9838 点击 2024-06-11 15:15