何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS'25 Oral
何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS'25 Oral一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可能的路径。
一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可能的路径。
在这个AI生成视频泛滥的时代,我们习惯看到“AI一键出片”“模版复刻”,却少有真正能触碰商业大片质感的作品。
最近,各种脑洞大开的「人类失踪」视频开始在网上爆火,播放量动辄几十万甚至上百万。不过,这些事情根本没发生过,全是由AI批量炮制的!大波网友边看边喊上头,在留言区真情实感起来。这些AI脑洞真假难辨,直接骗过了不少人,攻击力堪比「兔子蹦迪」。
可乐可乐是真头铁, 24年用AI做广告挨骂,25年继续用继续挨骂,主要是创意很偷懒,两年了还给我看同一条广告。
最近,在B站上出现了一个长达近7分钟的“纯AI综艺”,讲全世界6位厨师如何把灭绝了6500万年的远古沧龙做成6道菜,收获了700多万点击。有人压根没看出来这是AI做的,还以为是美国烹饪竞技真人秀《地狱厨房》出了续集。
11 月 3 日,据 Deadline 报道,AI 原生影视工作室 Utopai Studios 与全球创新投资平台 Stock Farm Road(SFR)宣布成立资本规模达数十亿美元的合资公司 Utopai East,以加速韩国影视的国际化进程。SFR 背后,一面是 LG 集团继承人 Brian Koo,另一面是阿联酋主权基金推动者 Amin Badr-El-Din。
AI 视频初创公司 Video Rebirth 今日宣布完成 5000 万美元的融资。本轮融资参与方阵容强大,包括全球及新加坡的头部美元基金、互联网巨头、中国及韩国老牌游戏上市公司、全球领先的芯片企业及知名家族办公室,募集资金将主要用于视频模型的持续迭代、顶尖人才招募及全球市场拓展。
每逢年底,都是各品牌推出假期广告的时候——也是最容易翻车的时候。可口可乐今年的圣诞广告,就翻车了,因为用了 AI,而且是第二次用了 AI。去年同期,他们就发过基本一样的圣诞广告,也是 AI,也是翻车。
想象一下,你正在玩一款开放世界游戏,角色在无缝衔接的世界中自由漫游,游戏引擎必须实时生成一条无限长的视频流来呈现这个虚拟世界。或者,你戴着 AR 眼镜在街头行走,系统需要根据你的视线与动作,即时生成与你环境交互的画面。无论是哪种场景,都对 AI 提出了同样的要求:能实时生成高质量、长时间连贯的视频流。
视频生成快速演进的脚步仍未停歇,就在今天,昆仑万维的新动作又一次突破行业想象。