AI资讯新闻榜单内容搜索-图像生成

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 图像生成

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一个高效的蒸馏扩散模型，专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏（sCM）和潜空间对抗蒸馏（LADD）的混合蒸馏策略，SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像，在速度和质量的权衡方面树立了新的标杆。

来自主题: AI技术研报

10586 点击 2025-03-31 16:16

GPT-4o骗了所有人，逐行画图只是前端特效？！底层架构细节成迷，奥特曼呼吁大家别玩了

GPT-4o骗了所有人，逐行画图只是前端特效？！底层架构细节成迷，奥特曼呼吁大家别玩了

GPT-4o骗了所有人，逐行画图只是前端特效？！底层架构细节成迷，奥特曼呼吁大家别玩了

GPT-4o玩家太疯狂，奥特曼紧急呼吁别再生成图片了：OpenAI团队为此一直在熬夜。为什么需要熬夜呢，自原生图像生成推出以来，必须一直有人守着才能保持服务器在线。

来自主题: AI资讯

8995 点击 2025-03-31 11:19

“计算机视觉被GPT-4o终结了”（狗头）

“计算机视觉被GPT-4o终结了”（狗头）

“计算机视觉被GPT-4o终结了”（狗头）

一夜之间，CV被大模型“解决”了（狗头）。万物皆可吉卜力之后，GPT-4o原生多模态图像生成更多玩法被开发出来。万物皆可吉卜力之后，GPT-4o原生多模态图像生成更多玩法被开发出来。

来自主题: AI资讯

8730 点击 2025-03-30 10:43

单张照片生成360°3D场景，支持灵活视角漫游｜人大&北师大&字节

单张照片生成360°3D场景，支持灵活视角漫游｜人大&北师大&字节

单张照片生成360°3D场景，支持灵活视角漫游｜人大&北师大&字节

从单张图像生成灵活视角3D场景的技术来了，在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。

来自主题: AI技术研报

7889 点击 2025-03-29 14:34

凌晨2点，再次Open！奥特曼宣布：OpenAI正式支持对手MCP协议

凌晨2点，再次Open！奥特曼宣布：OpenAI正式支持对手MCP协议

凌晨2点，再次Open！奥特曼宣布：OpenAI正式支持对手MCP协议

OpenAI昨夜又放大招，Agents SDK接入行业标准MCP，下一步加持ChatGPT桌面版，要彻底颠覆每个人AI工作流。自从昨天OpenAI将GPT-4o的原生图像生成同步开放给免费用户后，今天他们又Open了一把。

来自主题: AI资讯

11225 点击 2025-03-27 10:34

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

，清华大学、北京航空航天大学团队推出了全新的架构设计 ——Personalize Anything，它能够在无需训练的情况下，完成概念主体的高度细节还原，支持用户对物体进行细粒度的位置操控，并能够扩展至多个应用中，为个性化图像生成引入了一个新范式。

来自主题: AI技术研报

9018 点击 2025-03-26 09:04

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

个性化图像生成是图像生成领域的一项重要技术，正以前所未有的速度吸引着广泛关注。它能够根据用户提供的独特概念，精准合成定制化的视觉内容，满足日益增长的个性化需求，并同时支持对生成结果进行细粒度的语义控制与编辑，使其能够精确实现心中的创意愿景。

来自主题: AI技术研报

10993 点击 2025-03-25 14:50

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

超低成本图像生成预训练方案来了——仅需8张GPU训练，就能实现近SOTA的高质量图像生成效果。

来自主题: AI技术研报

10188 点击 2025-03-18 16:04

CVPR 2025 | VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

CVPR 2025 | VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

CVPR 2025 | VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

在 Sora 引爆世界模型技术革命的当下，3D 场景作为物理世界的数字基座，正成为构建动态可交互 AI 系统的关键基础设施。当前，单张图像生成三维资产的技术突破，已为三维内容生产提供了 "从想象到三维" 的原子能力。

来自主题: AI技术研报

9333 点击 2025-03-14 15:40

截胡OpenAI，谷歌全模态模型首次解禁！Gemini 2.0中文唠嗑式P图，动漫游戏圈沸腾

截胡OpenAI，谷歌全模态模型首次解禁！Gemini 2.0中文唠嗑式P图，动漫游戏圈沸腾

截胡OpenAI，谷歌全模态模型首次解禁！Gemini 2.0中文唠嗑式P图，动漫游戏圈沸腾

OpenAI的全模态模型没来，谷歌的全模态图像生成器倒是抢先上线了！Gemini 2.0 Flash中上线的原生图像生成功能，动动嘴就能PS，还能轻松制作海报和表情包，动漫和漫画圈已经沸腾了。

来自主题: AI资讯

11097 点击 2025-03-13 18:22

上一页当前第11页,共20页下一页