AI资讯新闻榜单内容搜索-扩散模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 扩散模型
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。

来自主题: AI技术研报
4177 点击    2024-04-07 17:46
值得你花时间看的扩散模型教程,来自普渡大学

值得你花时间看的扩散模型教程,来自普渡大学

值得你花时间看的扩散模型教程,来自普渡大学

Diffusion 不仅可以更好地模仿,而且可以进行「创作」。扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法,扩散模型另辟蹊径,其主要思想是一种先对图像增加噪声,再逐步去噪的过程,其中如何去噪还原图像是算法的核心部分。而它的最终算法能够从一张随机的噪声图像中生成图像。

来自主题: AI技术研报
45441 点击    2024-04-05 15:30
CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法

CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法

CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法

物体姿态估计对于各种应用至关重要,例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据,并且不能应用于测试时未见过的新物体;而类别级方法消除了这些假设(实例训练和 CAD 模型),但获取类别级训练数据需要应用额外的姿态标准化和检查步骤。

来自主题: AI技术研报
7390 点击    2024-04-04 15:32
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越大,也使得人类世界的真实数据即将枯竭。

来自主题: AI技术研报
10852 点击    2024-04-01 15:53
代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《加入wisemodel社区志愿者团队》以及《欢迎加入wisemodel开源共创计划》。

来自主题: AI资讯
8774 点击    2024-04-01 11:19
一张图即出AI视频!谷歌全新扩散模型,让人物动起来

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!

来自主题: AI技术研报
7549 点击    2024-03-28 16:52
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。

来自主题: AI技术研报
5483 点击    2024-03-28 15:31
Stability AI开源3B代码生成模型:可补全,还能Debug

Stability AI开源3B代码生成模型:可补全,还能Debug

Stability AI开源3B代码生成模型:可补全,还能Debug

Stable Diffusion 3 还没全面开放,这家公司的代码生成模型先来了。本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。

来自主题: AI技术研报
6128 点击    2024-03-27 11:15
3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建

受人类视觉系统的启发,MVDiffusion++结合计算方法高保真和人类视觉系统灵活性,可以根据任意数量的无位姿图片, 生成密集、高分辨率的有位姿图像,实现了高质量的3D模型重建。

来自主题: AI技术研报
6933 点击    2024-03-21 10:24