AI资讯新闻榜单内容搜索-图像生成

Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

图像生成界的“大魔王”Midjourney也来卷视频生成了？！

来自主题: AI资讯

10521 点击 2025-06-17 10:45

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

8726 点击 2025-06-10 16:18

在旧金山AI工程师世博会上，Simon Willison用自创「骑自行车的鹈鹕」图像生成测试，幽默回顾过去半年LLM的飞速发展。亲测30多款AI模型，强调工具+推理成最强AI组合！

来自主题: AI资讯

11419 点击 2025-06-09 15:23

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。有没有这样一个“AI创作大师”，你只需要用一句话描述脑海中的灵感，它就能自动为你搭建流程、选择工具、反复修改，最终交付高质量的视觉作品呢？

来自主题: AI技术研报

9385 点击 2025-06-07 14:49

FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型，支持文本与图像提示，角色一致性强，速度快达GPT-Image-1的8倍。

来自主题: AI资讯

9528 点击 2025-05-31 14:26

字节最近真的猛猛开源啊……这一次，他们直接开源了GPT-4o级别的图像生成能力。不止于此，其最新融合的多模态模型BAGEL主打一个“大一统”，将带图推理、图像编辑、3D生成等功能全都集中到了一个模型。

来自主题: AI技术研报

10516 点击 2025-05-24 17:34

普林斯顿大学与字节 Seed、北大、清华等研究团队合作提出了 MMaDA（Multimodal Large Diffusion Language Models），作为首个系统性探索扩散架构的多模态基础模型，MMaDA 通过三项核心技术突破，成功实现了文本推理、多模态理解与图像生成的统一建模。

来自主题: AI技术研报

10374 点击 2025-05-22 17:30

谷歌又放新大招了，将图像生成常用的“扩散技术”引入语言模型，12秒能生成1万tokens。

来自主题: AI资讯

8855 点击 2025-05-22 10:23

近年来，生成式人工智能的快速发展，在文本和图像生成领域都取得了很大的成功。

来自主题: AI技术研报

8067 点击 2025-05-18 16:01

R1 横空出世，带火了 GRPO 算法，RL 也随之成为 2025 年的热门技术探索方向，近期，字节 Seed 团队就在图像生成方向进行了相关探索。

来自主题: AI技术研报

9281 点击 2025-05-15 10:47