AI资讯新闻榜单内容搜索-生成模型

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法，实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报

6732 点击 2025-02-28 15:06

用完Claude 3.7，我感觉程序员在加速贬值

昨天，Claude 3.7 Sonnet 正式发布。根据目前的各项测评，这个模型可以说是全宇宙最好的代码生成模型，超越了 DeepSeek R1 和 OpenAI 的 o3 等模型。如果你是程序员，一定要第一时间切换过去，用下这款模型。

来自主题: AI资讯

6508 点击 2025-02-27 09:54

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

大自然的分形之美，蕴藏着宇宙的设计规则。刚刚，何恺明团队祭出「分形生成模型」，首次实现高分辨率逐像素建模，让计算效率飙升4000倍，开辟AI图像生成新范式。

来自主题: AI技术研报

10034 点击 2025-02-26 15:17

何恺明开辟分形图像生成新范式！计算效率提高4000倍，首次实现高分辨率逐像素生成

何恺明再次开宗立派！开辟了生成模型的全新范式——

来自主题: AI技术研报

3345 点击 2025-02-26 13:33

扩散模型新突破！无需微调，就能高效稳定移除目标物体

最近，扩散模型在生成模型领域异军突起，凭借其独特的生成机制在图像生成方面大放异彩，尤其在处理高维复杂数据时优势明显。然而，尽管扩散模型在图像生成任务中表现优异，但在图像目标移除任务中仍然面临诸多挑战。现有方法在移除前景目标后，可能会留下残影或伪影，难以实现与背景的自然融合。

来自主题: AI技术研报

7283 点击 2025-02-24 13:20

速递｜微软发布首个AI游戏生成模型Muse，加速推进游戏生成

微软研究院创建了 Muse，这是首个能够根据视觉或玩家控制器动作生成游戏环境的生成性 AI 模型。它理解 3D 游戏世界和游戏物理，并能够对玩家与游戏的互动做出反应。

来自主题: AI资讯

5609 点击 2025-02-20 16:36

全球最大开源视频模型，现在也Created in China了，阶跃出品

刚刚，阶跃星辰联合吉利汽车集团，开源了两款多模态大模型！新模型共2款：全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型，其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议，可任意编辑和商业应用。

来自主题: AI资讯

7977 点击 2025-02-18 14:43