字节跳动现象级 AI 视频模型Seedance 2.0终于发布正式论文!26 页详细报告、完整 Benchmark、171 位作者全名单公开,吴永辉、曾妍领衔核心团队,一举奠定多模态视频生成全球领先地位。这不仅是一次技术交底,更是字节在 AI 视频领域 “工业化能力” 的全面宣告。
一、论文概况:超大规模团队,技术透明度拉满
论文标题:Seedance 2.0: Advancing Video Generation for World Complexity
-
发布时间:2026 年 4 月 17 日
-
作者规模:171 人联合署名
-
核心带队:
-
吴永辉:Seed 团队基础研究负责人,直接汇报梁汝波
-
曾妍:Seedance 2.0 预训练负责人,美国 Palo Alto 团队核心
-
-
对比 1.5 Pro:197 人→171 人,共同作者 108 人,新增 62 人,离任 89 人
-
论文覆盖:架构思想、多模态能力、音视频联合生成、物理一致性、全场景 Benchmark
此次论文发布,恰逢 Seedance 2.0 通过BytePlus面向全球 100 多个国家开放 API,支持文本 / 图像 / 视频 / 音频多模态输入,输出4–15 秒、最高 720p视频,服务未开放美国区域。
二、核心技术突破:统一多模态架构,原生音视频联合生成
Seedance 2.0 的核心定位,是解决真实世界复杂度的统一多模态模型,彻底告别传统 “文本单向生成” 的局限seeddance.ai。
1. 四模态统一输入(业界首创)
-
文本 + 图像 + 视频片段 + 音频
-
支持 **@引用机制 **,精准指定风格、动作、镜头、节奏
-
一次性输入:最多 9 图 + 3 视频 + 3 音频,统一理解与融合
-
解决行业痛点:多素材引用不一致、反复调试、流程不可用
2. 原生音视频同步生成(架构级革命)
-
不采用 “先生视频后配音” 的两阶段流程
-
单模型同时输出视频 + 音频,帧级对齐
-
口型精准同步、脚步声 / 动作音 / BGM 完全匹配
-
支持 8 + 语言对话级唇形同步
3. 物理精准运动与角色一致性
-
重力、碰撞、运动轨迹符合物理规则
-
人物行走 / 奔跑 / 互动不扭曲、不穿模
-
多人同屏交互稳定,长期画面不崩坏
4. 内置 “AI 导演” 能力
-
自动分镜、自动运镜、自动剪辑节奏
-
支持剧情续写、局部编辑、指定对象修改
-
支持视频无缝扩展、局部重绘
三、Benchmark 屠榜:全维度第一,碾压 Sora 2 Pro、Veo 3.1
论文公开26 页评测数据,覆盖 VBench、SeedVideoBench 2.0、Arena.AI 等权威平台,在 6 大类场景、所有指标全面登顶。
Arena.AI 盲测排名(截至 4 月 8 日)
-
文生视频(T2V)
-
Seedance 2.0-720p:1450 分
-
Google Veo 3.1:1371 分
-
OpenAI Sora 2 Pro:1364 分
-
-
图生视频(I2V)
-
Seedance 2.0-720p:1449 分
-
Grok Imagine Video:1420 分
-
Google Veo 3.1:1404 分
-
六大场景全项第一(广告 / 剧情 / PGC / 特效 / 社交 / 基础)
在运动自然度、语义一致性、音画同步、美学、音频质量五大维度,Seedance 2.0 全部领先 Kling 3.0、Sora 2 Pro、Veo 3.1,是 ** 唯一全部超过 3.4 分(5 分制)** 的模型。
四、团队与人才:豪华阵容,薪资与期权曝光
核心团队
-
吴永辉:前 Google Fellow/DeepMind 副总裁,Seed 基础研究负责人,直接向梁汝波汇报
-
曾妍:预训练负责人,美国团队核心
-
团队汇聚全球顶尖多模态、DiT、视频生成专家
薪资辟谣与曝光
针对 “亿元挖郭达雅” 传闻,抖音副总裁李亮辟谣:
-
无亿元年薪
-
统一薪资结构:现金 + 字节期权 + 豆包期权
-
期权四年全额归属
-
直言:业务成功,部分人才四年收益可达数亿元
五、行业定位:从生成工具到 AI 视频操作系统
Seedance 2.0 标志着 AI 视频进入工业化可用阶段:
-
多模态统一输入,真正适配生产流程
-
音画原生同步,大幅削减后期成本
-
物理与角色稳定,可用率行业领先
-
企业级 API 全球部署,支持商业化落地
它不再是 “玩具级生成器”,而是可用于广告、电商、短视频、营销内容的工业化视频生产引擎。
六、总结
这篇 171 人联合署名的论文,宣告字节 Seedance 2.0 正式坐稳全球第一梯队。
-
架构:统一多模态,原生音视频同步
-
效果:物理精准、角色稳定、叙事完整
-
评测:全维度屠榜,超越 Sora、Veo
-
落地:全球 API 开放,企业级可用
随着论文技术细节公开,整个 AI 视频行业将再次加速迭代,而 Seedance 2.0 已经站在最前方。



