AI资讯新闻榜单内容搜索-自回归

新范式，自回归大一统！北大提出VARGPT：单一框架实现视觉「理解」与「生成」

VARGPT是一种新型多模态大模型，能够在单一框架内实现视觉理解和生成任务。通过预测下一个token完成视觉理解，预测下一个scale完成视觉生成，展现出强大的混合模态输入输出能力。

来自主题: AI技术研报

6845 点击 2025-01-28 12:07

UC伯克利等提出具身智能「动作Tokenizer」，效率飙升5倍！

研究者提出了FAST，一种高效的动作Tokenizer。通过结合离散余弦变换（DCT）和字节对编码（BPE），FAST显著缩短了训练时间，并且能高效地学习和执行复杂任务，标志着机器人自回归Transformer训练的一个重要突破。

来自主题: AI技术研报

7239 点击 2025-01-23 13:19

AAAI 2025 | 大模型推理加速新范式：加速比高达3.51倍、成本降至1/3

Falcon 方法是一种增强半自回归投机解码框架，旨在增强 draft model 的并行性和输出质量，以有效提升大模型的推理速度。Falcon 可以实现约 2.91-3.51 倍的加速比，在多种数据集上获得了很好的结果，并已应用到翼支付多个实际业务中。

来自主题: AI技术研报

6175 点击 2025-01-08 14:38

刚拿下NeurIPS最佳论文，字节就开源VAR文生图版本，拿下SOTA击败扩散模型

自回归文生图，迎来新王者——

来自主题: AI技术研报

2929 点击 2025-01-04 12:48

AAAI 2025｜时间序列演进也是种扩散过程？基于移动自回归的时序扩散预测模型

在时间序列预测领域，当前主流的扩散方法还是传统的基于噪声的方法，未能充分利用自回归技术实现时间序列建模。

来自主题: AI技术研报

6551 点击 2024-12-23 15:17

Grok祭出首款生图模型Aurora！两位95后华人立大功，耗时6月自研MoE

消失一天后的Aurora，正式上线了。一大早，马斯克官宣了Grok集成了自研图像新模型Aurora，MoE架构自回归模型，直接将生成编辑能力一统。在人物肖像生成上，已经逼真到肉眼无法辨别。

来自主题: AI技术研报

5361 点击 2024-12-10 16:22

AI视频边生成边播放！首帧延迟仅1.3秒，生成速度9.4帧/秒｜Adobe&MIT新研究

AI生成视频，边生成边实时播放，再不用等了！ Adobe与MIT联手推出自回归实时视频生成技术——CausVid。

来自主题: AI资讯

6233 点击 2024-12-10 16:18

关于计算机视觉中的自回归模型，这篇综述一网打尽了

随着计算机视觉领域的不断发展，自回归模型作为一种强大的生成模型，在图像生成、视频生成、3D 生成和多模态生成等任务中展现出了巨大的潜力。然而，由于该领域的快速发展，及时、全面地了解自回归模型的研究现状和进展变得至关重要。本文旨在对视觉领域中的自回归模型进行全面综述，为研究人员提供一个清晰的参考框架。

来自主题: AI技术研报

7257 点击 2024-12-01 14:21

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

自回归方法，在图像生成中观察到了 Scaling Law。「Scaling Law 撞墙了？」这恐怕是 AI 社区最近讨论热度最高的话题。

来自主题: AI技术研报

5424 点击 2024-11-26 13:48

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

【新智元导读】刚刚，一款专为消费级显卡设计的全新非自回归掩码图像建模的文本到图像生成模型——Meissonic发布，标志着图像生成即将进入「端侧时代」。

来自主题: AI技术研报

4397 点击 2024-11-12 15:06