AI资讯新闻榜单内容搜索-扩散模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 扩散模型
Open-Sora全面开源升级:支持16s视频生成和720p分辨率

Open-Sora全面开源升级:支持16s视频生成和720p分辨率

Open-Sora全面开源升级:支持16s视频生成和720p分辨率

Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。

来自主题: AI技术研报
6015 点击    2024-04-25 18:37
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩散模型在推理过程中天然存在的多步数迭代去噪特性导致了较高的计算成本。

来自主题: AI技术研报
7154 点击    2024-04-25 17:13
CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务

图像融合的目的是将同一场景中不同传感器捕获的多源图像的互补信息整合到单个图像上。这种方式通常被用于提取图片重要信息和提高视觉质量。

来自主题: AI技术研报
4016 点击    2024-04-24 10:00
微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人

微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人

微软「诈骗届」王牌框架,真到可怕!一张照片+音频即可生成数字人

在人物说话的过程中,每一个细微的动作和表情都可以表达情感,都能向观众传达出无声的信息,也是影响生成结果真实性的关键因素。

来自主题: AI技术研报
6837 点击    2024-04-23 14:43
Sora 平替出现了!字节 Dreamina 开放测试,申请就给用|AI 鲜测

Sora 平替出现了!字节 Dreamina 开放测试,申请就给用|AI 鲜测

Sora 平替出现了!字节 Dreamina 开放测试,申请就给用|AI 鲜测

最近,字节旗下的一款视频生成AI——Dreamina 开始大规模开放测试。 Dreamina 不算是新产品,但现在它与 Sora 最大的区别,不是模型能力,而是它真的是能使用的。

来自主题: AI资讯
2946 点击    2024-04-22 17:50
Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety Systems)负责人 Lilian Weng 写了一篇关于视频生成的扩散模型的博客。

来自主题: AI技术研报
8221 点击    2024-04-22 17:34
「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架

「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架

「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架

过去几年里,基于文本来生成图像的扩散模型得到了飞速发展,生成能力有了显著的提升,可以很容易地生成逼真的肖像画,以及各种天马行空的奇幻画作。

来自主题: AI技术研报
5783 点击    2024-04-21 23:20