字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列
7173点击    2026-04-17 15:18

现象级AI视频技术、字节Seedance 2.0在arXiv发论文了。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


晒了26页的Benchmark,和贡献者名单。


170位团队成员全公开,署名和尊重都拉满了,不过嘛这就不怕……嘛?


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


论文公布的时间节点,正赶上Seedance 2.0通过Byteplus平台铺向全球。


100多个国家的企业客户可以通过预付费API直接调用。支持文字、图片、视频、音频多模态输入,生成4到15秒MP4视频,最高720p。


但这个“全球”列表里,唯独没有美国。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


26页只写了两个字:能打


首先看标题,说成大白话就是“让AI视频生成能搞定现实世界里的各种复杂场景”


为了做到这一点,Seedance解决了过去生成式视频工具的一个瓶颈:


通常依靠单文本输入,在尝试引用真实素材(品牌图片、配音、先前的视频片段)时难以保持一致性,并且需要大量的反复试验才能制作出可用的作品。


对于创作者而言,这意味着迭代速度慢、输出结果不一致,以及工作流程无法满足实际制作需求。


突破方法在于Seedance是原生统一的模型,能够同时生成视频和音频 ——并且可以在一个系统中接收文本、图像、音频和视频作为输入。


  • 统一理解4种指令,支持文字 + 图片 + 视频 + 音频一起输入,能同时理解并融合
  • 人物走路、跑步、打架、跳舞更自然、不扭曲、符合物理规律,多人互动也不乱。
  • 音画天生同步,自带双耳立体声音频,说话、唱歌、脚步声、BGM和画面严丝合缝,口型对得准。
  • 会“当导演”,写一段剧情,它自动分镜头、自动运镜、自动剪辑节奏
  • 可以改指定人物、动作、场景;也能在现有视频后面无缝续拍


评测部分覆盖VBench等多个主流基准,质量、运动、语义一致性等维度全面量化对比。


Seedance 2.0直接站上了第一梯队,多项指标大幅领先同时期对手。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


最后两页是完整作者列表,共170人


与Seedance 1.5 Pro时期的197人相比,有89人不在2.0作者列表中,62人加入。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


其中稳定不变的核心人物可以找到吴永辉,现任字节跳动Seed团队基础研究负责人,是Seedance系列视频生成模型的最高技术决策者,直接向公司CEO梁汝波汇报。


曾妍,现任Seedance 2.0预训练负责人,是视频生成模型核心技术路线的关键执行者。工作地点位于美国帕洛阿尔托(Palo Alto)。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


One More Thing


有消息称字节花近亿元挖来了前DeepSeek研究员郭达雅。


抖音副总裁李亮亲自下场辟谣:不实,Seed团队薪资体系统一,近期没有招聘到近亿元年薪的员工。


字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列


辟谣归辟谣,但这段话还披露了Seed的完整薪资结构:现金+字节期权+豆包期权,四年全部归属。


到这,本来可以结束了。


但李亮又加了一句话。


Seed员工的字节和豆包期权未来收益根据期权价格有波动,假如业务发展得很好,不排除有些Seed技术人员四年后收益会达到数亿元。


这简直是借辟谣在招人了。


“数亿”两个字比任何招聘广告都有杀伤力。


论文地址:https://arxiv.org/abs/2604.14148


参考链接:

[1]https://www.byteplus.com/en/activity/seedance2-0

[2]https://weibo.com/7965906915/QB6lMCaGo


文章来自于微信公众号 "量子位",作者 "量子位"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费