AI TNT— 让一部分先用AI实现商业化

只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。

来自主题: AI技术研报

8930 点击 2024-07-29 20:28

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。

来自主题: AI技术研报

7850 点击 2024-07-29 19:58

近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。

来自主题: AI技术研报

3880 点击 2024-07-23 16:40

想象一下你在刷短视频，系统想要推荐你可能会喜欢的内容。

来自主题: AI技术研报

8056 点击 2024-07-07 13:56

只需Image Tokenizer，Llama也能做图像生成了，而且效果超过了扩散模型。

来自主题: AI资讯

7859 点击 2024-07-04 11:09

事实证明，扩散模型不仅能用于生成图像和视频，也能用于合成新程序。

来自主题: AI技术研报

4620 点击 2024-06-29 17:49

超越扩散模型！自回归范式在图像生成领域再次被验证——

来自主题: AI技术研报

8061 点击 2024-06-26 18:21

3D场景理解让人形机器人「看得见」周身场景，使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形，从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注，从而急剧提升时间成本和资源投入。

来自主题: AI技术研报

7732 点击 2024-06-23 19:44

在生成式模型的迅速发展中，Image Tokenization 扮演着一个很重要的角色，例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间（latent space），使得生成高分辨率图像更有效率。

来自主题: AI技术研报

8939 点击 2024-06-22 23:00

从任意单目视频重建可渲染的动态场景是计算机视觉研究领域的一个圣杯。

来自主题: AI技术研报

8944 点击 2024-06-21 19:54