无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention
无需训练,即插即用,2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制计算量急剧增加,成为推理效率的最大瓶颈。
在高质量视频生成任务中,扩散模型(Diffusion Models)已经成为主流。然而,随着视频长度和分辨率的提升,Diffusion Transformer(DiT)模型中的注意力机制计算量急剧增加,成为推理效率的最大瓶颈。
现实版的「一人得道」!AI云服务商CoreWeave上市3个月后,CEO赚麻了,直接跻身全球顶级富豪榜Top 500。暴富速度,史上第二!这轮涨势也带动了其他几位联合创始人「一夜暴富」:首席战略官Brian Venturo目前资产达64亿美元,首席开发官Brannin McBee的身家则为47亿美元。
国产GPU第一股要来了?! 最新消息,摩尔线程完成上市辅导。 官网显示,摩尔线程智能科技(北京)股份有限公司IPO辅导状态已变更为“辅导验收”,辅导机构为中信证券股份有限公司。
普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和生成效率。
今年 4 月,围绕“华为芯片效率是否超越国际主流 AI 芯片和架构”的问题,网上曾引发一场激烈争论。
推理模型开始「自言自语」、量子计算进入临界点……AI大航海时代已然启航,这不是一次产品发布会,而是未来的预言书。巴黎GTC大会,黄仁勋开讲了!这次他脱下了皮衣。
20人国内团队,竟然提前2年预判到了DeepSeek的构想?玉盘AI的全新计算架构方案浮出水面后,直接震动业内:当前AI算力的核心瓶颈,他们试图从硬件源头解决!
1.93bit量化之后的 DeepSeek-R1(0528),编程能力依然能超过Claude 4 Sonnet?
3D生成模型高光时刻来临!DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练,效果超闭源模型,直指影视级精细度。
虽然 AMD 已投入大量资金来加速其 Instinct 数据中心 GPU 的开发,以便与 Nvidia 最强大的 AI 芯片正面交锋,但该公司也大力依赖收购,以便能够提供“端到端 AI 解决方案”。