舍弃自回归,离散扩散语言模型如何演化?NUS综述解构技术图谱与应用前沿
舍弃自回归,离散扩散语言模型如何演化?NUS综述解构技术图谱与应用前沿本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。
本文主要介绍 xML 团队的论文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。
大家好我是歸藏(guizang),今天给大家带来秘塔深度研究的体验。
当前最强大的视觉语言模型(VLMs)虽然能“看图识物”,但在理解电影方面还不够“聪明”。
Agent能力每7个月翻一番!
我们独家获悉,大模型公司 MiniMax 近 3 亿美元的新一轮融资已接近完成,投后估值超过 40 亿美元(约 300 亿元人民币)。结合公开信息,目前国内达到这一估值的大模型公司有 MiniMax 和智谱。
近日,基于自研多模态大模型,旨在打造AI应用的“超级感官”与“真大脑”的创业公司——无界方舟(AutoArk)宣布连续完成Pre-A & Pre-A+轮亿元级别融资
涌现(Emergence),是生成式AI浪潮的一个关键现象:当模型规模扩大至临界点,AI会展现出人类一般的智慧,能理解、学习甚至创造。
超长上下文窗口的大模型也会经常「失忆」,「记忆」也是需要管理的。
我每天都使用AI,我认为提示工程是一项高级认知技能。
从GPT-2到Llama 4,大模型这几年到底「胖」了多少?从百亿级密集参数到稀疏MoE架构,从闭源霸权到开源反击,Meta、OpenAI、Mistral、DeepSeek……群雄割据,谁能称王?