别被 Demo 骗了：Seedance 2.0 真实出片率到底多少

每次有新的视频模型发布，官方 Demo 都好看得不行。Seedance 2.0 也不例外——追逐戏的运镜行云流水，广告片的产品细节纤毫毕现，角色表情生动自然。

但 the-decoder 在报道里说了一句大实话：这些 Demo "almost certainly cherry-picked from a larger batch"。翻译过来就是，官方挑了最好的几条给你看，失败的那些你永远看不到。

所以真实环境下的出片率到底怎么样？我做了一次比较认真的测试。

测试方法

我准备了 50 个 Prompt，覆盖 10 个常见场景类型，每个类型 5 个不同的 Prompt。全部用 Pro 版本生成，每个 Prompt 只生成一次，不反复抽卡。

评判标准很简单——这条视频能不能直接用（发到抖音/小红书/客户群里），不需要任何修改或遮挡。如果有明显的人物变形、穿帮、画面崩坏、音画不同步，就算"不可用"。

这个标准比较严格。有些轻微的瑕疵（比如背景里有个物体形状略奇怪）如果不仔细看发现不了，我也算"可用"。

50 条视频里：

62% 的一次成功率。这个数字比我预期的要好。作为对比，我去年测 Seedance 1.0 Pro 的时候，同样标准下大概只有 40%。

但 62% 也意味着，你每生成 10 条视频，平均有 4 条需要重新来或者只能扔掉。

各场景的成功率差距很大。

几个关键发现。

产品和风景类视频最稳。 没有人物，没有复杂运动，模型只需要处理相对简单的物理规律。9 成以上的出片率，基本可以信赖。

单人场景及格，多人场景翻车率高。 一个人在画面里走路、做简单动作，大部分时候没问题。但两个人一互动——握手、对话、拥抱——手部穿模的概率直线上升。手指数量不对的老问题虽然比以前好了，但没有完全消失。

快速动作是重灾区。 打斗、奔跑、跳跃这类场景，7 成概率会出现肢体扭曲。胳膊弯到不可能的角度，腿在空中消失一帧又出现。如果你的视频需要激烈动作，做好多生成几次的心理准备。

文字生成依然不靠谱。 这几乎是所有视频模型的通病。Prompt 里写"text overlay: Premium Quality"，生成出来的文字大概率是乱码或者变形字母。需要文字的场景，建议生成无文字版本，后期用剪映加字幕。

基于这 50 条的经验，几个实测有效的方法：

Prompt 越具体越好。 "一个女人走在街上"的出片率远低于"一个穿红色大衣的年轻女性在雨天的东京街头撑伞行走，镜头从正面缓慢后退"。模型拿到的信息越多，乱发挥的空间越小。

避免在一个 Prompt 里塞太多动作。 "角色先坐下，然后站起来，转身走到窗边，打开窗户"——这四个动作在 10 秒内全做完，失败率极高。一次只给一到两个动作就好。

人物数量控制在两个以内。 三个人以上的场景，成功率断崖式下降。如果确实需要群戏，不如分开生成再合成。

不要让模型写字。 任何需要文字的部分都在后期添加。这一条简单但很多人忘。

同一个 Prompt 生成 3-5 次，挑最好的。 这是最笨但最有效的方法。即使是翻车率高的场景类型，多生成几次总能抽到一条能用的。3 次的"至少一条可用"概率：

所以即使是最难的动作戏场景，生成 5 次也有 83% 的概率至少拿到一条能用的。

我翻了一下去年 8 月测 Seedance 1.0 Pro 时的笔记，做个对比：

半年时间，总体可用率从 40% 提升到 62%。手指问题减少了一半多。面部一致性和音画同步都有明显进步。

按这个速度推算，再过半年到年底，总体可用率可能能到 75-80%。那时候大多数场景下"一次成功"会变成常态，"多次抽卡"变成少数情况。

但现在还没到那个阶段。现在的 Seedance 2.0 是一个"好用但需要耐心"的工具。别指望每次都一键出片，做好多试几次的准备，结果不会让你失望。

如果你用 Seedance 2.0 做商业项目，报价的时候把"多次生成挑选"的时间和成本算进去。按平均每条成品需要生成 3 次来估算，你的实际成本是单次生成成本的 3 倍、时间是单次的 2 倍（因为可以并行生成）。

别按官方 Demo 的完美效果去给客户做预期，按实测 62% 的成功率来做预期管理。客户最终看到的成品当然是精挑细选的最好结果，但你的报价和排期要按真实情况来。