开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
仅凭一张照片,能否让行人继续行走、汽车继续飞驰、云朵继续流动,并让你从任意视角自由观赏?
AI编程最近挺火的,大家喜欢冠以一个貌似更高级的词:vibe coding
一句话概括,传统MoE就像公司派固定人数团队,Grove MoE则像智能调度系统,小项目派少数人,大项目集中火力,效率与效果兼得。
我们需要「AI母亲」,而非「AI助手」!在Ai4 2025大会上,「AI教父」再次表达了他对AI安全的担忧。他警告说人类要继续控制AI是虚幻的希望,并提出与之相反的有趣视角:为AI建立「母性本能」。
我们决定用一位普通人的真实经历开启这个新公号——未来人类实验室。不是为了再讲一次“AI多么神奇”,而是把神话拆开,给你看好奇—上手—走弯路—复盘的全过程:它哪里真有用,哪里会让人抓狂,为什么“零代码”“一键生成”的口号常常把人带进沟里。
随着ChatGPT,DeepSeek等一批AI大模型被人们越来越多运用到日常生活和工作中,用ChatGPT解答疑问,编写程序,创作音乐和写作,成为了越来越多人的日常。
在今年的 ACM KDD 2025 大会上,清华大学电子系团队联合中国移动发布了 UoMo,全球首个面向移动网络的通用流量预测模型。UoMo 能同时胜任短期预测、长期预测,甚至在没有历史数据的情况下生成全新区域的流量分布。
忘掉你学过的一切提示词技巧吧,你只需要这一个就够了。
作为老牌企业软件巨头 IgniteTech 公司 CEO,Eric Vaughan 在回顾自己数十年职业生涯中最激进的决策时,仍然意志坚定、毫不动摇。