AI资讯新闻榜单内容搜索-Image

刚刚，好莱坞特效师展示AI生成的中文科幻大片，成本只有330元

多模态的生成，是 AI 未来的方向。最近，AI 领域的气氛正在发生微妙的变化。比如，刚刚推出了 Grok 4 的 xAI 却在重点宣传他们的视频生成模型 Grok Image。

来自主题: AI资讯

7192 点击 2025-08-22 09:19

开源复现o3图像思考！快手让AI不再被动看图，模型自主生成代码调用工具

在Openai 发布o3后，think with image功能得到了业界和学术界的广泛关注。

来自主题: AI技术研报

8208 点击 2025-08-21 15:25

凌晨战神Qwen又搞事情！新模型让图像编辑“哪里不对改哪里”

瞧，上面这套“哪里不对改哪里”的操作，就来自“凌晨战神”Qwen团队最新发布的——Qwen-Image-Edit。作为Qwen-Image20B的图像编辑版，Qwen-Image-Edit除了能做上面这种精准的文字修改，还能够新增、消除、重绘、修改元素，而且还支持IP编辑、视角切换、风格迁移等生成式玩法。

来自主题: AI资讯

8133 点击 2025-08-19 21:32

刚刚，阿里图像编辑大杀器Qwen-Image-Edit上线，横扫像素与语义编辑，网友：再见PS

今天凌晨，阿里推出了最新图像编辑模型 Qwen-Image-Edit！该模型基于 200 亿参数的 Qwen-Image 架构构建，支持中英文双语精准文本编辑，在保持原有风格的同时完成修改。此外，Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL（实现视觉语义控制）和 VAE Encoder（实现视觉外观控制），兼具语义与外观的双重编辑能⼒。

来自主题: AI资讯

9597 点击 2025-08-19 08:52

从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？

近年来，文生图模型（Text-to-Image Models）飞速发展，从早期的 GAN 架构到如今的扩散和自回归模型，生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛，为设计、教育、艺术创作等领域带来了前所未有的便利。

来自主题: AI技术研报

7935 点击 2025-08-12 11:31

Qwen新开源，把AI生图里的文字SOTA拉爆了

通义模型家族，刚刚又双叒开源了，这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。这也是通义千问系列中首个图像生成基础模型。

来自主题: AI技术研报

7524 点击 2025-08-05 17:10

画到哪，动到哪！字节跳动发布视频生成「神笔马良」ATI，已开源！

近年来，随着扩散模型（Diffusion Models）、Transformer 架构与高性能视觉理解模型的蓬勃发展，视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务（Image-to-Video generation）尤其受到关注，其关键优势在于：能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。

来自主题: AI技术研报

8173 点击 2025-07-03 10:07