AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
扩散模型里的噪声,原来还有这样的作用:DRDD重新定义统一图像翻译

扩散模型里的噪声,原来还有这样的作用:DRDD重新定义统一图像翻译

扩散模型里的噪声,原来还有这样的作用:DRDD重新定义统一图像翻译

在图像到图像翻译(Image-to-Image Translation, I2I)这个任务上,扩散模型过去几年几乎形成了一套默认逻辑:先把输入图像和噪声混合,再一步步去噪,把目标图像 “还原” 出来。

来自主题: AI技术研报
9385 点击    2026-06-10 15:15
ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

近年来,文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image,扩散模型已经能够生成高质量图像,也能处理越来越复杂的文本提示。

来自主题: AI技术研报
9132 点击    2026-06-09 10:02
一步生成 ImageNet FID 1.29!斯坦福用 Wasserstein 梯度流重写一步生成模型

一步生成 ImageNet FID 1.29!斯坦福用 Wasserstein 梯度流重写一步生成模型

一步生成 ImageNet FID 1.29!斯坦福用 Wasserstein 梯度流重写一步生成模型

训练时让分布沿最优传输的 “下山方向” 走,推理时只需一次网络前向。W-Flow 把多步演化压进静态生成器,在 ImageNet 256×256 上刷新一步生成指标。

来自主题: AI技术研报
9301 点击    2026-06-03 14:34
AI实验室Agnes AI开放全模态不限时免费API!重点是免费!

AI实验室Agnes AI开放全模态不限时免费API!重点是免费!

AI实验室Agnes AI开放全模态不限时免费API!重点是免费!

在这场日益蔓延的“Token焦虑”中,Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布,自6月1日起,旗下全模态模型API无限期免费开放。Agnes AI本次开放覆盖其三款核心模型:文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。

来自主题: AI资讯
11740 点击    2026-06-01 11:24
李飞飞造了ImageNet,现在她又带人超越了它

李飞飞造了ImageNet,现在她又带人超越了它

李飞飞造了ImageNet,现在她又带人超越了它

就在前两天,斯坦福大学等机构发布了一个名为 GPIC(Giant Permissive Image Corpus,巨型开放图像语料库)的数据集。

来自主题: AI技术研报
8888 点击    2026-05-30 15:57
DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里,在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch,DeepSeek-V4-Pro研究和写作,GPT-Image2画图。论文共迭代6次(V1:4 次,V2:1 次,V3:1 次),总耗时6天,进行了约108轮Agent调用,消耗64.8万token,写了2234行LaTeX代码。

来自主题: AI资讯
9691 点击    2026-05-27 09:47
VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。

来自主题: AI技术研报
7499 点击    2026-05-26 10:26