AI资讯新闻榜单内容搜索-扩散模型

刚拿下NeurIPS最佳论文，字节就开源VAR文生图版本，拿下SOTA击败扩散模型

自回归文生图，迎来新王者——

来自主题: AI技术研报

2813 点击 2025-01-04 12:48

一张图生成高质量广视野3D场景，还可控制摄像轨迹

只需一张图，就能生成高质量、广范围的3D场景！泰迪熊、花园、山谷都从平面图片变成了仿佛触手可及的立体物品。

来自主题: AI技术研报

6607 点击 2024-12-30 19:13

可在手机终端部署，人大等提出全新人物图片保护模型RID

近年来许多论文研究了基于扩散模型的定制化生成，即通过给定一张或几张某个概念的图片，通过定制化学习让模型记住这个概念，并能够生成这个概念的新视角、新场景图片。

来自主题: AI技术研报

7063 点击 2024-12-28 14:04

视觉语言模型易受攻击？西安交大等提出基于扩散模型的对抗样本生成新方法

对抗攻击，特别是基于迁移的有目标攻击，可以用于评估大型视觉语言模型（VLMs）的对抗鲁棒性，从而在部署前更全面地检查潜在的安全漏洞。然而，现有的基于迁移的对抗攻击由于需要大量迭代和复杂的方法结构，导致成本较高

来自主题: AI技术研报

7111 点击 2024-12-28 14:01

终于等来能塞进手机的文生图模型！十分之一体量，SnapGen实现百分百的效果

近些年来，以 Stable Diffusion 为代表的扩散模型为文生图（T2I）任务树立了新的标准，PixArt，LUMINA，Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而，目前的这些文生图（T2I）扩散模型受限于模型尺寸和运行时间，仍然很难直接部署到移动设备上。

来自主题: AI技术研报

6756 点击 2024-12-25 14:02