
字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持
字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持图像生成中的多指标一致性问题,被字节团队解决了! 字节UXO团队设计并开源了统一框架USO,让看上去不关联的任务相互促进,实现风格迁移和主体保持单任务和组合任务的SOTA。
图像生成中的多指标一致性问题,被字节团队解决了! 字节UXO团队设计并开源了统一框架USO,让看上去不关联的任务相互促进,实现风格迁移和主体保持单任务和组合任务的SOTA。
最近,一个叫 nano-banana 的神秘 AI 生图模型火了! 说它神秘,是因为到现在也没有公司出来认领这个模型。 而且它的火爆也不是靠什么营销,而是凭借它出色的性能大家的“口口相传”。 甚至有网友评价它是人物一致性新王、AI 图片编辑史诗级升级。
通义模型家族,刚刚又双叒开源了,这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。 这也是通义千问系列中首个图像生成基础模型。
AI生图,但是没有AI味,可能么? 一款全新、可编辑、照片级的AI生图模型FLUX.1 Krea [dev]现已发布,可在Krea Edit上免费试用。
你有没有想过,为什么大部分人在谈论AI的时候还在纠结ChatGPT能写多少字、回答多少问题,而有些人已经在用AI创造出让你分不清真假的视频内容?当全世界还在为文本生成AI争论不休时,一家名为fal的公司却在悄然重塑整个内容创作的基础设施。
每次和我妈打电话,她都会不可避免地提一嘴:「少吃点外卖。」 以前我觉得这是典型中年父母的唠叨,不太了解年轻人的生活方式。现在我懂了,她才是早就看穿一切的预言家。
这篇文章,我会从几个真实的案例出发,深度拆解一下星流这款产品,以及聊聊:为什么我认为「可控」才是真正的生产力?星流到底如何做到「可控」?以及,「可控性」为什么会是下一阶段 AIGC 的竞争关键?
图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。 有没有这样一个“AI创作大师”,你只需要用一句话描述脑海中的灵感,它就能自动为你搭建流程、选择工具、反复修改,最终交付高质量的视觉作品呢?
FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。
AI生图新突破!一个模型同时接受文本和图像输入。