不懂 Seedance 2.0 的提示词门道,你每次生成的基本都是垃圾。创意再好、钱花得再多也没用。这篇文章就是这门语言的完整参考。
这个模型对镜头、灯光、运动和约束条件有自己的一套语言。普通英文描述直接丢进提示框,效果堪比跟只懂日语的人讲法语。
框架来自几百次实测、官方 Volcengine 文档、所有值得看的 Higgsfield / Yaroflasher 教程,加上社区验证过确实有效的技巧。全部压缩成一篇文章,用 Seedance 2.0 生成视频时开着这篇文章做参考就行。
SEEDANCE 2.0 到底是什么
它不是文生视频工具,是一个多模态电影片场。两者的差距,大概等于在 Google 搜图和执导一支 $50,000 商业广告之间的距离。
单次生成你能喂给它:
- 最多 9 张参考图(角色表、mood board、产品照、分镜)
- 最多 3 个视频片段(镜头运动参考、编舞、节奏)
- 最多 3 条音轨(配音、音乐、音效)
- 再加上文本提示
12 个参考文件同时丢进一个双分支扩散 Transformer,视频和音频在单次推理里一起出来。不是后期拼接,也不是两条管道硬凑。
一次推理,同步输出带双声道立体声音频的视频。唇同步支持 8+ 种语言,还有背景音乐和拟音。输出长度 4-15 秒,分辨率最高 1080p。
Sora 2、Kling 3.0、Veo 3.1 都只吃文本+图片。Seedance 同时吃四种模态。而且如果你只会往提示框里打字,大概只用了这个工具 15% 的能力,却付了和别人一样的钱。


5 层提示词结构
官方文档给的是 6 元素公式,社区实测后压缩成了 5 层,效果比又臭又长的提示词稳定得多:
主体 > 动作 > 镜头 > 风格 > 约束
顺序很重要:
- 主体 放前面,给模型一个重心,避免注意力被分散
- 动作 第二位,提供动态锚点
- 镜头 第三位,趁模型还没开始每几秒重选一次焦距之前锁死构图
- 风格 放后面,加视觉风味但不去抢运动的戏
- 约束 最后兜底,把前面四层没堵住的漏洞补上

第 1 层:主体
主体描述得越细,效果越稳。
| 级别 | 示例 |
|---|---|
| 差 | a woman |
| 还行 | a young woman with brown hair |
| 最好 | a woman in her late 20s, tight dark curls at ear length, small silver hoop in left ear, wearing a fitted black turtleneck, neutral expression |
你多给一条身份标记,模型就少一次幻觉。头发长度、衣服质感、姿势、配饰、皮肤细节,不写清楚就会漂移。
最安全的路径是单次生成只放一个人。两个人可以,但要空间分离并分别打标签。三个人以上基本就是在抛硬币了。

第 2 层:动作
现在时态,每个镜头一个主要运动。90% 的提示词死在这里——大家写的是状态,不是指令。
| 级别 | 示例 |
|---|---|
| 差 | she looks happy and is enjoying the sunset |
| 好 | she slowly turns toward the camera, breeze lifting the hem of her skirt, eyes narrowing against the light |
前者给了模型一张照片让它去凑,后者给了一个序列让它执行,差距非常大。
一条几乎没人遵守的规则:主体运动和镜头运动永远分开写。
"spinning camera around a dancing person" 是一条指令,模型根本不知道谁该转。改成 "the dancer spins slowly, camera holds fixed framing",歧义拆成两条清晰指令,大部分抖动和混乱输出都会消失。

第 3 层:镜头
Seedance 把镜头方向当作一等条件信号,这是它跟其他产品拉开差距的核心。
每次生成只给一个主要镜头运动。用节奏词描述(slow, smooth, gentle),别堆技术规格。官方不鼓励写 f-stop、ISO、精确毫米数,模型对描述性语言的理解比对摄影机元数据更好。
🖱️ 镜头关键词库
| 类型 | 关键词 |
|---|---|
| 静态镜头 | fixed / locked-off · static wide · locked tripod, zero camera shake |
| 推拉 | push-in / dolly in(制造张力)· pull-out / dolly out(交代环境) |
| 摇移 | pan left/right(水平摇)· tracking shot / follow(跟拍) |
| 环绕 | orbit / arc / 360 orbit(产品展示、肖像、英雄时刻) |
| 航拍/升降 | aerial / drone shot · crane up/down |
| 手持/稳定 | handheld(纪录片感)· gimbal(精致电影感)· steadicam walk |
| 特效镜头 | whip pan(快速横摇)· dolly zoom(希区柯克眩晕)· rack focus(移焦) |
⚡ 速度修饰词
| 速度 | 关键词 |
|---|---|
| 推荐 ✅ | imperceptible / barely(极慢)· slow / gentle / gradual(默认)· smooth / controlled |
| 慎用 ⚠️ | dynamic / swift(高冲击力) |
| 危险 🔥 | fast — 最危险的词!fast camera + fast subject + busy scene 几乎必出抖动和压缩伪影 |
想要复合镜头运动?按顺序排: "start: slow dolly-in, then: gentle pan right for the final 2 seconds"

第 4 层:风格
灯光、调色、电影参考、氛围。
官方 Volcengine 指南说,灯光描述对视频质量的影响是最大的,比风格形容词大,比 quality modifier 大,比分辨率请求大。如果只能给弱提示加一样东西,加灯光描述。
💡 稳定产出的灯光词
| 关键词 | 效果 |
|---|---|
golden hour |
性价比最高的单条改进 ⭐ |
rim light / dramatic rim light |
电影感边缘分离 |
soft key from 45 degrees |
flattering 访谈灯光 |
overcast daylight |
消除明亮场景的闪烁 |
backlit silhouette at sunset |
戏剧性氛围 |
volumetric fog |
大气深度 |
chiaroscuro |
《教父》式高对比灯光 |
🎨 调色
teal and orange(经典好莱坞)· bleach bypass(低饱和高对比)· warm tone / amber-tinted(怀旧)· crushed blacks(深沉暗部)· pastel(柔和 aesthetic)
🎬 电影参考
cinematic film tone, 35mm(最稳万能锚点)· 16mm film, handheld(独立电影感)· anamorphic lens flare(宽银幕)· national geographic quality(纪录片质感)
⚠️
"cinematic"单独用等于没给模型任何约束,官方直接说 too vague。要写cinematic film tone, 35mm, warm golden lighting这样给三个交叉约束。⚠️
"glow"、"glimmer"、"glints"容易引出镜面闪烁伪影。换成steady intensity或diffuse。

第 5 层:约束
这是护栏层,也是 AI 感视频和”看不出来是 AI”的视频之间的分界线。
🔒 每个角色提示必加
avoid jitter— 画面别抖avoid bent limbs— 胳膊腿别扭曲,每次必加,没有例外avoid identity drift— 角色特征别变了样avoid temporal flicker— 帧间亮度别跳no distortion, no stretching— 保持几何稳定maintain face consistency— 脸别跨镜头变脸
✅ 社区通用质量后缀
sharp clarity, natural colors, stable picture, no blur, no ghosting, no flickering
❌ 看起来有用,其实没用的词
| 无效词 | 为什么没用 |
|---|---|
fast(不加限定) |
让模型同时加速所有东西 |
cinematic(单独用) |
没给模型任何可执行信息 |
epic |
对扩散模型没有视觉意义 |
amazing / beautiful / stunning |
这是感受不是指令,模型渲染不了形容词 |
lots of movement |
会触发全画面抖动 |
glow / glimmer / glints |
产生镜面闪烁 |
核心原则:如果一个词描述的是观众应该感受什么,而不是摄影机应该看到什么,模型就只能猜——而它通常猜错。

时间轴分镜:在 15 秒里切多个镜头
Seedance 真正跟其他模型不一样的地方:你可以在单次 15 秒生成里用时间戳来导演分镜。
格式 A(方括号):
[0-4s]: wide establishing shot, static camera, misty bamboo forest at dawn, golden hour light [4-9s]: medium shot, slow push-in, the fighter steps forward, white silk kimono billowing [9-15s]: close-up, orbit shot, the fighter strikes, slow motion, impact visible in fabric ripple
格式 B(圆括号):
(0-3s) macro shot of perfume bottle among pink flowers, shallow depth of field (3-7s) camera glides closer, a feminine hand enters frame, touches the bottle (7-12s) slow-motion spray, mist diffuses in air, particles catching rim light (12-15s) pull-out to hero frame, product centered, volumetric lighting
每个镜头都要写清楚镜头位置、主体动作和灯光状态。过渡语言像 "hard cut to"、"seamless morph into" 能给模型明确的剪辑指令。
15 秒高潮弧模板
[0-4s]: wide shot, static, world established [4-8s]: medium shot, slow push-in, tension building [8-12s]: close-up, emotional peak approaching [12-15s]: extreme close-up or dramatic reveal, climax, slow motion
电影里最常用的升级模式:wide → tighter → tight → closest,直接套进 15 秒的生成窗口里。

引用语法
每个上传的文件在提示词里都必须有明确角色。没有 @ 标签的图片会被模糊处理,而扩散模型里的模糊性结果就是平均化——视觉上就是糊成一片。
首帧-末帧技术是整篇里最被低估的捷径。上传你想要的首帧作为 @Image1,末帧作为 @Image2,描述中间发生什么,Seedance 会自动插值出连接两端的连贯运动。不需要画分镜,也不需要多步 pipeline。

5 个示例
1. 口播视频 (UGC)
15 seconds UGC style review video, filmed on smartphone, natural bedroom window lighting, casual handheld selfie angle, a young woman with brown hair pulled back, natural skin with visible texture, wearing a casual grey t-shirt, in her cozy bedroom, she holds a product up to the camera with genuine excitement, quick jump cut slightly closer angle, she applies it showing the texture, jump cut she leans into the camera with a natural smile, the lighting is soft natural daylight no ring light no filters, direct phone mic audio room ambience natural voice
2. 产品英雄片
ultra cinematic 15-second luxury product commercial, smooth continuous sequence, (0-3s) macro shot of product on dark surface shallow depth of field rim light catching edges, (3-7s) camera glides closer warm light rakes across surface revealing texture, (7-11s) slow motion detail moment volumetric lighting, (11-15s) pull-out to centered hero frame product isolated premium minimalist background, sharp clarity no jitter stable picture
3. 电影感场景
cinematic film tone 35mm warm golden hour lighting, a man in his 40s with weathered features sits at a wooden desk in a sun-drenched workshop carefully carving walnut wood, slow push-in from medium shot to close-up on his hands, dust motes float in the light beams from the window, shallow depth of field background softly blurred, earthy color palette, avoid jitter avoid bent limbs, stable picture no temporal flicker
4. 动作序列(带时间码)
high-intensity cinematic fight in a misty bamboo forest 15 seconds photorealistic, [0-4s]: wide establishing shot static camera mist rolling between bamboo stalks golden hour light, [4-8s]: medium tracking shot the fighter in white lunges forward with a spinning strike, [8-12s]: low-angle power shot impact moment slow motion bamboo leaves scatter, [12-15s]: pull-out wide shot the fighter in white stands victorious rim light, avoid bent limbs maintain face consistency
5. 完整多模态制作
@Image1 角色参考 · @Image2 环境参考 · @Video1 镜头运动参考 · @Audio1 背景音乐 15-second cinematic sequence 16:9 2K resolution, character from @Image1 walks through the environment from @Image2, camera performs slow orbit matching @Video1's motion arc, scene transitions align with beat positions of @Audio1, golden hour rim lighting shallow depth of field, maintain character identity across all frames, avoid identity drift avoid jitter avoid temporal flicker, sharp clarity stable picture

迭代工作流
先用提示词生成 2-3 个基线版本,然后只改一个变量——镜头、灯光、速度修饰词,就一样。
给每次生成在连续性和遵循度上打分,保留最好的,再改下一个变量。受控迭代虽然每轮慢一点,但收敛更快。
如果运动太微弱,可以在提示词开头加 dynamic motion 或 vibrant energy。这是全局强度修饰词,会放大你已经指定的运动,但不会引入新的运动类型。

关于成本
火山引擎 Seedance 2.0 的成本计算公式:
- 0.046 元/千 tokens
- Token数 =(宽 × 高 × 帧率 × 时长)/(1024 × 条数)
- 1 秒 1080×720 视频 ≈ 0.84 元
- 1 秒 480p 视频 ≈ 0.5 元
建议平常使用 480p 进行调试,稳定后再使用更高分辨率进行批量化生产。

总结
Seedance 2.0 是目前最强的多模态视频模型。5 层结构、关键词库、约束系统、@ 引用标签——就是完整工具包。
建议收藏,生成时开着这篇参考用,而不是读完就丢。
本文来自转载DracoVibeCoding ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

