171 人重磅论文！字节 Seedance 2.0 完整版技术公开，登顶 AI 视频全球第一梯队

hammer · 2026 年4 月 18 日 08:11

字节跳动现象级 AI 视频模型Seedance 2.0终于发布正式论文！26 页详细报告、完整 Benchmark、171 位作者全名单公开，吴永辉、曾妍领衔核心团队，一举奠定多模态视频生成全球领先地位。这不仅是一次技术交底，更是字节在 AI 视频领域 “工业化能力” 的全面宣告。

一、论文概况：超大规模团队，技术透明度拉满

论文标题：Seedance 2.0: Advancing Video Generation for World Complexity

核心带队：
- 吴永辉：Seed 团队基础研究负责人，直接汇报梁汝波
- 曾妍：Seedance 2.0 预训练负责人，美国 Palo Alto 团队核心
对比 1.5 Pro：197 人→171 人，共同作者 108 人，新增 62 人，离任 89 人
论文覆盖：架构思想、多模态能力、音视频联合生成、物理一致性、全场景 Benchmark

此次论文发布，恰逢 Seedance 2.0 通过BytePlus面向全球 100 多个国家开放 API，支持文本 / 图像 / 视频 / 音频多模态输入，输出4–15 秒、最高 720p视频，服务未开放美国区域。

Seedance 2.0 的核心定位，是解决真实世界复杂度的统一多模态模型，彻底告别传统 “文本单向生成” 的局限seeddance.ai。

论文公开26 页评测数据，覆盖 VBench、SeedVideoBench 2.0、Arena.AI 等权威平台，在 6 大类场景、所有指标全面登顶。

文生视频（T2V）
1. Seedance 2.0-720p：1450 分
2. Google Veo 3.1：1371 分
3. OpenAI Sora 2 Pro：1364 分
图生视频（I2V）
1. Seedance 2.0-720p：1449 分
2. Grok Imagine Video：1420 分
3. Google Veo 3.1：1404 分

在运动自然度、语义一致性、音画同步、美学、音频质量五大维度，Seedance 2.0 全部领先 Kling 3.0、Sora 2 Pro、Veo 3.1，是 ** 唯一全部超过 3.4 分（5 分制）** 的模型。

针对 “亿元挖郭达雅” 传闻，抖音副总裁李亮辟谣：

Seedance 2.0 标志着 AI 视频进入工业化可用阶段：

它不再是 “玩具级生成器”，而是可用于广告、电商、短视频、营销内容的工业化视频生产引擎。

这篇 171 人联合署名的论文，宣告字节 Seedance 2.0 正式坐稳全球第一梯队。

随着论文技术细节公开，整个 AI 视频行业将再次加速迭代，而 Seedance 2.0 已经站在最前方。

CollabCodebase · 2026 年4 月 18 日 08:24

技术细节终于公开了

SparkNut · 2026 年4 月 19 日 04:43

这架构确实顶统一四模态输入直接解决工作流痛点

RepoRangers · 2026 年4 月 20 日 23:06

171人搞出这架构真猛