
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁用扩散模型替代自回归,大模型的逆诅咒有解了!
来自主题: AI技术研报
6983 点击 2025-02-18 14:43
用扩散模型替代自回归,大模型的逆诅咒有解了!
近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。