AI资讯新闻榜单内容搜索-图像生成

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 图像生成

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像？ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像？ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像？ID-Patch带来新解法

扩散模型（Diffusion Models, DMs）如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力，它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。

来自主题: AI技术研报

8943 点击 2025-05-03 14:52

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成！

复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案，在一个框架内兼顾了图文理解与图像生成任务，并在多个权威评测中取得了领先的性能表现。

来自主题: AI技术研报

8511 点击 2025-04-25 09:56

刚刚，OpenAI最强图像生成API上线，一张图1毛5

刚刚，OpenAI最强图像生成API上线，一张图1毛5

刚刚，OpenAI最强图像生成API上线，一张图1毛5

OpenAI推出图像生成API，低至0.02美元/张，支持多模态定制。

来自主题: AI资讯

10869 点击 2025-04-24 20:53

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯

10863 点击 2025-04-24 09:44

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成，现在有了开源版啦！

来自主题: AI技术研报

10061 点击 2025-04-23 15:02

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

基于Transformer的自回归架构在语言建模上取得了显著成功，但在图像生成领域，扩散模型凭借强大的生成质量和可控性占据了主导地位。

来自主题: AI技术研报

9757 点击 2025-04-19 15:01

剑指马斯克，OpenAI 被曝秘密打造社交网络，可能是个 AI版小红书

剑指马斯克，OpenAI 被曝秘密打造社交网络，可能是个 AI版小红书

剑指马斯克，OpenAI 被曝秘密打造社交网络，可能是个 AI版小红书

就在刚刚，据外媒 The Verge 援引知情人士消息称，OpenAI 正在研发一个类似 X（前 Twitter）的社交网络。项目还处于早期阶段，但据称内部已完成原型开发 2️⃣ 项目重点是 ChatGPT 的图像生成功能和社交信息流 3️⃣ CEO Sam Altman 已私下向圈外人征求反馈

来自主题: AI资讯

10046 点击 2025-04-16 10:49

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

北京大学团队继VARGPT实现视觉理解与生成任务统一之后，再度推出了VARGPT-v1.1版本。该版本进一步提升了视觉自回归模型的能力，不仅在在视觉理解方面有所加强，还在图像生成和编辑任务中达到新的性能高度

来自主题: AI技术研报

8661 点击 2025-04-16 09:44

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了！

来自主题: AI技术研报

8564 点击 2025-04-09 17:37

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

视觉Token可以与LLMs词表无缝对齐了！

来自主题: AI技术研报

9724 点击 2025-04-03 15:48

上一页当前第10页,共20页下一页