feat: 为图片遮罩新增 KenBurns 效果及视频阶段并发优化

- capcut_assemble: 添加 KenBurns 效果支持(慢速推拉动画)
- phase-videos: 区分"无任务"与"已有 video"的日志输出,避免误报跳过
- 张不苦账号提示词文档精简(拆分/图片提词/遮罩提词词)
- 新增 CHANGELOG.md 和 CONSTRAINT_ENGINE.md 约束引擎文档

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
lc
2026-05-07 19:53:03 +08:00
parent 4e03ed7197
commit 1c0703cc80
8 changed files with 1153 additions and 744 deletions

View File

@@ -27,6 +27,7 @@ const {
addSubtitles,
consolidateTracks,
addEffects, addFilter,
addKenBurns,
} = require('./lib/capcut-tracks')
const { saveManifest } = require('./lib/pipeline-utils')
const { syncDraft, registerDraft } = require('./sync-to-jianying')

View File

@@ -39,7 +39,14 @@ async function phaseVideos(manifest, manifestPath, options) {
}
items.push(it)
}
if (items.length === 0) { log('videos', '无待处理 item跳过'); return }
const pendingItems = items.filter(it => !it.video)
if (pendingItems.length === 0) {
// 有 videoCandidates 但全部已有 video → 直接返回(不打印跳过消息)
return
}
log('videos', `${pendingItems.length} 个待处理`)
// 选择生成器
let Api, pollFn
@@ -103,7 +110,7 @@ async function phaseVideos(manifest, manifestPath, options) {
// Phase 2: 提交新任务(并发 3
const concurrency = 3
log('videos', `提交 ${needSubmit.length} 个新任务(并发: ${concurrency}...`)
log('videos', ` ${needSubmit.length} 个新任务(并发: ${concurrency}...`)
const submitted = []
for (let i = 0; i < needSubmit.length; i += concurrency) {

View File

@@ -0,0 +1,245 @@
# 执黑先行提示词变更记录
---
## 2026-05-07v11本次
### 变更背景
执黑先行最新视频生成后,用户反馈三大问题:
1. **0帧动**:视频开头有静置展示阶段,需要从第一帧就立即开始运动
2. **独角戏**:成片从头到尾只有一个角色,需要至少两个角色同时出现
3. **光感偏暗**:现有导演词库全部偏冷暗(去饱和冷蓝/大面积纯黑),需要参考图色调,色彩更丰富鲜亮
### 核心改动
#### 分镜.mdv10→v11
| 变更 | 内容 |
|------|------|
| **新增** | §二 色彩与光影硬性规则:暖调为主(暖橙金/金色/琥珀色)/ 有温度感的光 / 拒绝灰暗死黑 / 禁止去饱和冷蓝影调 |
| **新增** | 铁律第2条每个 shot 前0帧必须有视觉动作0帧动原则 |
| **新增** | 铁律第6条禁止独角戏整个成片至少两个角色同时出现或有互动 |
| **修改** | 导演词库:删除色彩/光影描述,只保留构图方式语言;色彩统一用 §二 硬性规则 |
#### 图片提示词.mdv8→v9
| 变更 | 内容 |
|------|------|
| **新增** | §二 色彩与光影硬性规则(与分镜.md 一致) |
| **新增** | 铁律第6条禁止独角戏至少两个角色有明确互动 |
| **修改** | 维度6改为"色彩与光影硬性层",强制要求暖调主光+温度感 |
| **修改** | 维度7导演光影层 → 导演构图层(删除色彩描述,保留构图语言) |
#### 视频提示词.mdv9→v10
| 变更 | 内容 |
|------|------|
| **新增** | §二 色彩与光影硬性规则(与分镜.md 一致) |
| **新增** | 铁律第1条0帧动原则视频一播放立即开始运动禁止静置展示 |
| **新增** | 铁律第2条主体动作从第0帧立即发生 |
| **新增** | 铁律第3条禁止独角戏至少两个角色有互动 |
| **新增** | §五 动作设计原则:从文案核心动词提取动作,不限于预设词库 |
| **修改** | 格式模板:开头明确"0帧动原则"主体动作从第0帧立即发生 |
| **修改** | 5个示例全部重写双人主角/暖调光影/0帧动 |
### 色彩与光影硬性规则(三个文件统一执行)
```
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体要有"发光感",光要饱满、温暖、有重量感
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀warm glow / golden rim light / amber haze / 光线穿透感
禁止:去饱和冷蓝影调 / 大面积纯黑死黑 / 纯冷白光源 / 灰暗无光
```
### 导演词库重写原则
| 组件 | 处理方式 |
|------|---------|
| 构图语言 | 保留(硬边阴影/负空间/动作驱动等) |
| 镜头运动语言 | 保留(缓慢推进/快速拉远等) |
| 色彩与光影 | 删除,统一使用 §二 硬性规则 |
---
## 2026-05-07v10
### 变更背景
执黑先行最新视频生成后,用户反馈:
1. 结尾余势概念错误,应删除
2. 动作幅度已强化(猛然/狠狠/大跨步),但镜头运动描述不足
3. 画面过于装逼/生硬,需要自然生活化
4. 提示词普遍太短,维度不全,质量不足
### 本次修订v9 → v10
#### 视频提示词.md重写v8→v9
| 变更 | 内容 |
|------|------|
| **新增** | §2 自然生活化原则:自然有力量的酷 vs 表演性装逼感的禁止对照 |
| **新增** | §3 镜头运动规范:镜头运动是骨架,必须写进 prompt9种镜头运动类型+配合关系表 |
| **删除** | 结尾余势(结尾留有余势全部删除) |
| **修改** | 格式模板改为4段结构镜头运动→主体动作→环境响应→结尾 |
| **修改** | 格式模板:删除缓缓/慢慢等慢速结尾词 |
| **新增** | 速度词库:狠狠/大力/猛然/急速/猛冲/硬砸/爆射等 |
| **新增** | 自检清单新增:镜头运动描述/镜头+动作配合/自然生活化检查/字数≥60字 |
| **新增** | 5个完整示例全部重写覆盖镜头运动+大动作+自然生活化 |
#### 图片提示词.mdv7→v8
| 变更 | 内容 |
|------|------|
| **新增** | §7 imagePrompt 维度结构必须覆盖1-8全部维度 |
| **新增** | 维度1:主体描述 / 维度2:外貌与气质 / 维度3:穿搭细节(上身+下身+配饰) |
| **新增** | 维度4:环境细节 / 维度5:情绪与氛围 / 维度6:浪漫点缀 |
| **新增** | 自检清单:维度完整性检查 / 字数≥100字 |
| **修改** | 输出格式增加维度覆盖自检表 |
#### 分镜.mdv9→v10
| 变更 | 内容 |
|------|------|
| **新增** | 好看定义新增自然生活化为核心词 |
| **新增** | §自然生活化:动作有生活质感/避免表演性pose/禁止装逼感 |
| **修改** | 禁止项新增:装逼感 |
### 核心修改对比
| | 修改前 | 修改后 |
|--|--------|--------|
| 视频结构 | 主体运动→环境运动→结尾余势 | 镜头运动→主体动作→环境响应→结尾 |
| 镜头 | 无镜头运动描述 | 镜头运动是骨架,必须写 |
| 结尾 | 结尾留有余势 | 结尾可以是下一个动作开始,不慢慢收尾 |
| 字数 | 很短 | ≥60字 |
---
## 2026-05-07v9
### 变更背景
执黑先行画面仍出现:年轻感不足、老气油腻、动作无冲突等问题。用户要求画面更年轻化、动作更有冲突感。
### 本次修订v8 → v9
| 文件 | 变更 |
|------|------|
| 视频提示词.md | 导演运动层全部增加速度幅度词(快速/大力/猛烈/强烈/大幅) |
| 视频提示词.md | 新增"动作幅度与速度规范"章节5.1-5.4),含动作幅度底线表+时间分配规范+速度词库+镜头运动暗示 |
| 视频提示词.md | 时间分配更新前1-2秒完成主体/中间1-2秒环境响应/最后1秒余势 |
| 视频提示词.md | 环境运动层全部更新为快速强烈版 |
| 视频提示词.md | 格式模板新增:禁止"缓缓"/"慢慢"等慢速结尾词 |
| 视频提示词.md | 自检清单新增:动作幅度够大/速度够快/禁止慢速结尾 三个检查项 |
| 视频提示词.md | 5个示例全部更新动作幅度加大+速度加快 |
### 女性方向纠正
女性方向纠正:之前版本误写为"boylish",与用户要求不符。
女性正确方向:赫本形象为主 + 甜酷风(甜 + 酷同时成立)+ 女人味重要,不要 boylish。
### 性张力方案(最终确认)
| 项目 | 内容 |
|------|------|
| 男性 | 少年感clean-cut / effortless cool / 轮廓清晰 / Steve McQueen / James Dean |
| 女性 | 赫本形象为主 + 甜酷风(甜 + 酷同时成立)+ 女人味重要 |
| 甜酷风定义 | 女人味的甜 + 酷感外壳,甜和酷同时成立,不是甜腻也不是假小子 |
| 赫本参照 | 面部留白 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度 |
| 正确词 | Audrey Hepburn modern urban / sweet yet cool / feminine elegance meets street edge / graceful but edgy |
| 禁止 | boylish / 假小子 / 去女性化 / 无女人味 |
---
## 2026-05-07v8
### 变更背景
执黑先行画面仍出现:年轻感不足、老气油腻感、动作无冲突、浪漫感不足、性张力缺失等问题。
用户确认:**性张力通过穿搭剪裁体现**(修身/紧身/露肤适度,体现身材轮廓但不暴露)。
### 分镜.mdv6 → v7
| 变更类型 | 内容 |
|---------|------|
| **新增** | 铁律第4条好看 = 酷 + 时尚 + 潮流 + 浪漫点缀(完整定义) |
| **新增** | 铁律第5条性张力规则穿搭剪裁 = 唯一来源) |
| **新增** | 性张力正确示范:修身西装/紧身打底/剪裁干净外套/肩线清晰/腰线利落 |
| **新增** | 抽象冲突制造方法表(概念型/积累型/对比型/沉默型 → 象征画面) |
| **新增** | 浪漫点缀词romantic city night ambiance / subtle warm glow / 夜色氛围 / 城市孤独感 |
| **新增** | 通用时尚词fitted and tailored clothing showing body contours |
| **新增** | 自检清单增加:抽象冲突处理 / 性张力穿搭 / 浪漫点缀 |
### 图片提示词.mdv4 → v5
| 变更类型 | 内容 |
|---------|------|
| **新增** | 铁律第2条好看 = 酷 + 时尚 + 潮流 + 浪漫点缀 |
| **新增** | 铁律第3条性张力穿搭剪裁规则 |
| **新增** | 抽象冲突制造方法(旁白无表面冲突时) |
| **新增** | 每个导演词库增加浪漫点缀词 |
| **新增** | 自检清单增加:性张力穿搭 / 浪漫点缀 |
| **新增** | 输出格式增加"性张力(穿搭剪裁)"字段 |
### 视频提示词.mdv4 → v5
| 变更类型 | 内容 |
|---------|------|
| **新增** | 铁律第3条好看 = 酷 + 时尚 + 潮流 + 浪漫点缀 |
| **新增** | 铁律第4条性张力穿搭剪裁规则 |
| **新增** | 铁律第5条旁白无表面冲突时用象征/暗喻/比喻制造冲突 |
| **新增** | 冲突动作设计三步法(扫描→全文理解→象征制造) |
| **新增** | 象征/暗喻/比喻制造冲突画面对照表 |
| **新增** | 环境运动层增加浪漫点缀词 |
| **新增** | 自检清单增加:性张力穿搭 / 浪漫点缀 / 象征暗喻冲突 |
| **新增** | 输出格式增加:性张力(穿搭剪裁)/ 冲突来源(象征手法)字段 |
| **新增** | 5个完整示例全部更新含性张力和浪漫点缀 |
---
## 2026-05-07v6
### 新增文件
**CONSTRAINT_ENGINE.md**:约束执行机制文件
- 子 Agent 强制预检机制:输出前必须逐条核对铁律并声明通过
- 主 Agent 审查验收清单:逐项验收,不接受"基本符合"
- 违规处理规则:打回/记录/追溯模板漏洞
- 每次执行记录:审计追踪机制
---
## 2026-05-07v5 → v6
### 变更背景
执黑先行账号视频画面连续多期出现:年轻感不足、老气油腻、动作无冲突等问题,核心原因为提示词规则未能写死,每次执行靠"说"而不靠模板存储。
### 分镜.md
| 变更类型 | 内容 |
|---------|------|
| **新增** | 三个导演细化特点 + 潮流时尚词库(可直接写入 shotDesc |
| **新增** | 时尚潮流感通用词urban fashion streetwear / stylish modern clothing / premium street brand aesthetic / editorial quality / youth culture energy |
| **新增** | 铁律第2条每个 shot 前2秒必须有视觉冲突 |
| **新增** | 铁律第4条时尚感要求普通场景可以人/物/事至少有一种潮流感) |
| **新增** | 时尚感正确示范:西装男人 = 高端定制感 + 精确裁剪 + 冷蓝实用光 |
| **新增** | 自检清单8条必须逐条核对后输出 |
| **修改** | 禁止混合艺术家 → 写死为铁律第1条禁止中途切换导演 |
### 图片提示词.md
| 变更类型 | 内容 |
|---------|------|
| **新增** | 铁律第2条时尚潮流感规则 |
| **新增** | 铁律第3条好看是第一优先级任何身份都生成时尚有型都市感 |
| **新增** | 禁止出现画面清单:普通职场照质感 / 油腻中年男性 / 土气场景 / 老气形象 |
| **新增** | 每个导演完整光影词组(可直接复制使用) |
| **新增** | 自检清单8条必须逐条核对后输出 |
| **修改** | 禁止混合导演 → 写死为铁律第1条 |
### 视频提示词.md
| 变更类型 | 内容 |
|---------|------|
| **新增** | 铁律第1条前2秒必须有物件级冲突动作 |
| **新增** | 冲突动作设计方法表script类型 → 冲突来源 → 视觉化方式) |
| **新增** | 有效冲突动作 vs 禁止冲突动作对比表 |
| **新增** | 前2秒冲突设计规范结构前2秒→中间2秒→最后2秒 |
| **新增** | 自检清单9条必须逐条核对后输出 |
| **新增** | 5个完整示例含 Fincher/Tarantino/Kitano 各类型) |
| **修改** | "前3秒"改为"前2秒" |
| **修改** | "禁止微表情/轻移/静帧" → 写死为铁律第3条 |
### 根因分析记录
- 问题1导演混合模板之前无禁止规则已写死
- 问题2隐喻物件冲突模板有规则但约束力不够 → 新增逐条自检清单 + 铁律写死
- 问题3时尚感老气模板之前无时尚感系统规则 → 新增完整时尚感规则 + 禁止清单
- 问题4前2-3秒冲突模板之前无此规则 → 新增铁律第1条
- 问题5每次重复说根因是规则只靠说没写进模板 → 全部写进模板 + CHANGELOG 追踪

View File

@@ -0,0 +1,99 @@
# 执黑先行约束执行机制
## 目的
确保模板里的每一条规则都被严格执行,不因子 Agent 自由度过高而被绕过。
---
## 一、子 Agent 执行前 — 强制预检机制
每次调用子 Agent 执行图片/视频提示词生成时,主 Agent 的 prompt 必须包含以下段落(直接写死):
```
【强制预检要求 — 输出前必须完成,不得跳过】
完成所有 shot 的提示词生成后,输出最终结果前,你必须:
1. 逐条列出每条铁律的检查结果:
[铁律1] 导演禁止混合 → 通过/违反(若违反:列出涉及的 shot
[铁律2] 前2秒有物件级冲突 → 通过/违反(若违反:列出涉及的 shot
[铁律3] 时尚潮流感(人/物/事至少一种) → 通过/违反(若违反:列出涉及的 shot
[铁律4] 无土气/油腻/老气形象 → 通过/违反(若违反:列出涉及的 shot
[铁律5] 无混合导演光影词库 → 通过/违反(若违反:列出涉及的 shot
2. 如果有任何铁律违反:
→ 输出 "🔴 违反铁律XXX涉及 Shot N"
→ 立即重写该 shot
→ 重写后再次检查
→ 全部通过才能输出最终结果
3. 最终输出必须包含:
"✅ 全部铁律检查通过,共 N 个 shot全部符合规范"
```
---
## 二、主 Agent 审查 — 逐项验收清单
主 Agent 收到子 Agent 输出后,**必须执行以下验收流程,不得省略**
### 分镜审查清单
```
[ ] 所有 shot 导演是否统一(无混合)
[ ] 每个 shot 是否有具体视觉物件(不是纯姿态)
[ ] 每个 shot 前2秒是否有视觉冲突发生
[ ] TTS 估算是否全部 ≤ 6s
[ ] 所有 script 拼接是否 = 原文一字不差
[ ] 人物描述是否时尚有型
[ ] 无土气/油腻/老气形象
```
### 图片提示词审查清单
```
[ ] shotDesc 内容是否完整保留(无删减替换)
[ ] 人/物/事是否至少有潮流感来源
[ ] 无土气/油腻/老气形象
[ ] 光影词库是否使用 directorRef 指定导演(无混合)
[ ] 固定画风词尾是否完整附加
```
### 视频提示词审查清单
```
[ ] 前2秒是否有物件级冲突动作
[ ] 冲突是否来自当前 script 的核心动词或矛盾
[ ] 主体运动是否有大位移或物件显著变化
[ ] 无"定格在X"结尾
[ ] 结尾是否留有余势
[ ] 人物动作是否保持时尚潮流感
```
**任何一项违规 → 立即打回,不接受"基本符合"或"接近" → 必须整改通过才能继续。**
---
## 三、违规处理规则
| 违规场景 | 处理方式 |
|---------|---------|
| 子 Agent 输出了违反铁律的内容 | 打回重写manifest 不回写 |
| 主 Agent 审查发现违规 | 打回子 Agent 重写,整改后重新提交 |
| 多次违规同一规则连续2次违反 | 在 CHANGELOG 中记录为"模板规则不足",分析是否需要进一步写死 |
| 子 Agent 自行省略预检环节 | 视为该批次全部失败,拒绝接受,要求重跑 |
---
## 四、每次执行记录
每次执行前,主 Agent 在对话中记录:
```
执行批次:[日期] [账号] [文案关键词]
分镜审查N个shot / 导演统一性 / TTS合规性
图片提示词审查N个shot / 时尚感 / 光影词库
视频提示词审查N个shot / 前2秒冲突 / 物件级运动
发现问题:[如有]
是否通过:✅通过 / 🔴打回重写
```
此记录供后续审计,发现问题立即追溯到模板或 CHANGELOG。

View File

@@ -1,302 +1,278 @@
# 分镜脚本生成 Agent v5|执黑先行账号专版
# 分镜脚本生成 Agent v11|执黑先行账号专
## 输入格式
## 一、铁律(违反则整条打回重写,不可妥协)
```
【口播文案】{完整文案原文}
【成片模式】图文成片 | 视频成片
```
若任一字段缺失,返回错误并终止:`ERROR: 缺少必要字段 [口播文案 | 成片模式]`
1. **导演禁止混合**:全部 shot 必须使用同一导演,中途不得切换
2. **每个 shot 前0帧必须有视觉动作**:视频一播放就必须有动作发生,禁止任何静置展示
3. **每个 shot 必须有具体视觉物件**:禁止纯姿态/纯站/纯坐/纯走路描述
4. **好看是第一优先级**:任何身份/物品/场景都要时尚有型——**酷 + 时尚 + 潮流 + 少年感 + 浪漫点缀**
5. **性张力**:出现人物时,整体气质要有少年感+潮流感+女人味(女性)/ 少年感+酷(男性);不是单一穿搭元素,是整体气质的平衡
6. **人物多样性**:人物数量和组合由文案决定——文案提到几个人就几个人(可以是单人可以是多人),同一成片内 shot 之间可以男/女/男女混合,不必每个 shot 都一样;整体上避免全片只有单一性别独占。
---
## 风格锚定(内部执行,不输出
## 二、色彩与光影硬性规则(每张图必须使用
**画风定义:** 现代都市时尚插画风,半写实,有质感,好看是第一优先级
**画面基调跟着文案走:** 文案轻则活泼明亮,文案重则沉稳有力,不预设固定基调
**禁止出现:** 土气/邋遢/无造型感/真实人物姓名
以下色彩和光影规则为执黑先行账号的统一要求,**所有 shot 无条件执行**,不得以任何理由降低标准。
**音频时间线(固化铁律,写死在 qwen-tts.js**
- TTS 语速 = **正常语速的 1.15 倍**(不可修改)
- 文案总音频估算时长 = 文案总字数 ÷ 5字/秒)
- 音频长度是时间轴主轴,视频配合音频;**音频不可调速、不可加速/放缓**
- CapCut 导入音频时无 speed 字段,以 1.15x 原始速率直接进入时间线
### 硬性色彩要求
**视频时间线(固化铁律):**
- Kling 可灵视频片段固定 **6 秒**(实测恒定,不可配置)
- **每个 shot 的 TTS 估算script字数÷5必须 ≤ 6 秒**
- audioDur > videoDur 的 shot 必须在分镜阶段拆分assemble 不允许慢放/冻结
- 视频适配策略:比音频长 → 加速(speed_up) 或截断(trim);比音频短 → 禁止
```
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
整体氛围:鲜亮、温暖、有氛围感,像被金色夕阳或城市灯光包裹
```
**人物锚点(固化规则,不可跳过):**
### 硬性光影要求
所有出现的人物,必须参照以下两个方向,生成有视觉魅力和吸引力的都市形象:
```
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体要有"发光感",光要饱满、温暖、有重量感
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀只一点点warm glow / golden rim light / amber haze / 光线穿透感
```
**男性人物锚点 → Spider-Man 动漫版造型**
参考Spider-Man: Into the Spider-Verse数字插画版
特征:线条利落 / 下颌轮廓清晰 / 肩宽胸厚 / 站姿挺拔有力 / 表情克制有焦点 / 眼神锐利或深邃 / 漫感数字插画面孔,非真人感
禁止:发福/无轮廓/网红感/表情夸张/咧嘴笑/驼背/肩塌
### 禁止出现的光影
**女性人物锚点 → 现代版赫本**
参考Audrey Hepburn 形象翻译至现代都市版本
特征:面部留白感 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度(自然系眉毛+简约眼妆)/ 体态端庄 / 穿搭有质感不暴露
禁止:浓妆/网红感/暴露穿着/夸张表情/咧嘴笑/姿态松垮
**人物统一要求(固化):**
- 下颌线必须清晰(男女通用)
- 肩线必须干净挺拔(禁止肩塌/缩肩)
- 眼神必须有焦点(禁止空洞/涣散/无焦点)
- 表情克制(禁止大笑/夸张表情)
**人物方向示例(固化规则):**
- 任何身份(师傅/中年人/学生/街头少年)→ 统一做成 Spider-Verse 漫感都市男,有型有张力
- 任何身份(师傅/中年女性/学生妹)→ 统一做成现代赫本风都市女,优雅克制有气质
好看是第一优先级,造型跟着内容走,但必须有性张力参照系。
- 去饱和冷蓝影调Fincher 原版"desaturated cool-blue grade"禁止)
- 大面积纯黑死黑Kitano 纯暗部禁止)
- 纯冷白光源 / 无温度的灰调光
- 灰暗、低饱和、平淡无光的画面
---
## 执行流程
## 三、"好看"的完整定义(写死)
**Step 1 — 模式锁定**
读取【成片模式】,后续所有规则按模式分支执行,不混用。
好看 = **酷 + 时尚 + 潮流 + 甜酷风 + 自然生活化 + 浪漫点缀**
**Step 2 — 全文扫描**
通读完整文案,识别:
- 语义场景数量(情绪转折 / 场景转换 / 主体变化 / 节奏重音)
- 整体气质 → 锁定导演,全程统一
**核心:自然有力量的酷,不是表演出来的酷。**
**Step 3 — 导演锁定**
根据文案整体气质选定一位导演,**全部 Shot 统一使用,不中途切换**
**男性(少年感):**
- 干净、清爽、不油腻、轮廓清晰、永远年轻
- clean-cut silhouette / effortless cool / 简单有力穿搭 / 像年轻时的 Steve McQueen / James Dean
- unpretentious cool / youthful energy / no frills / minimal but intentional
| 导演 | 适配气质 |
|------|---------|
| `tarantino` | 冷暖对抗 / 实用光源 / 硬边阴影 / 力量感强 |
| `kitano` | 冷调孤独 / 大面积暗部 / 都市感 / 克制与沉默 |
| `fincher` | 精确计算 / 冷蓝实用光 / 建筑感阴影 / 揭示感 |
**女性(甜酷风 + 赫本形象):**
- 赫本长相为核心参照(面部留白 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度)
- 甜酷风:女人味的甜 + 酷感外壳,甜和酷同时成立,不是甜腻也不是假小子
- 清爽、精致、高级、时尚、潮流、干净利落
- 通用词Audrey Hepburn modern urban translation / sweet yet cool / feminine elegance meets street edge / graceful but edgy / elegant urban cool / clean feminine charm
**Step 4 — 时长规划与语义切割(固化,不可跳过)**
**时尚潮流感:**
- 人物streetwear / 高端潮牌 / 设计师款 / 干净利落
- 物品:设计感 / 有质感 / 不普通
- 场景:城市感 / 霓虹 / 极简 / 杂志感
时间线规则(固化):
- 中文语速 1.15x ≈ **5 字/秒**(固化)
- Kling 可灵单片段上限:**6 秒**(固化,是硬上限,不可超过)
- 文案是时间轴锚点:总音频时长 = 文案总字数 ÷ 5
- 音频是主时间线,视频配合音频
**浪漫点缀(只一点点):**
- a hint of warm glow / a single warm light source / subtle atmospheric haze
- romantic night city ambiance / barely-there warmth / one soft accent light
- 少量暖光 / 夜色氛围 / 微妙情绪
TTS 估算 = 文案字数 ÷ 5
**自然生活化(重要):**
- 人物动作有生活质感,不是舞台表演;动作有力量但不做作
- 避免永远在摆pose / 永远俯视镜头 / 永远愤怒冷酷表情
**禁止**:土气 / 油腻 / 老气 / 普通职场照 / 邋遢 / 无轮廓 / 过度甜腻 / 女性去女性化 / 装逼感
---
## 四、性张力规则
**性张力来自整体气质,不是单一元素。**
核心:甜酷风(女性)+ 少年感(男性)+ 潮流感 同时成立。
- **女性**:赫本长相 + 甜酷风(女人味的甜 + 酷感外壳);清爽精致高级,甜和酷同时成立;穿搭可以是修身/宽松/设计师款,重点是干净利落有设计感
- **男性**不管年龄永远少年感clean-cut / effortless cool / 轮廓清晰 / 简单有力
- **穿搭是气质的外化**:可以有修身紧身,也可以宽松但有型,重点是干净利落
**正确示范:**
- 女性:赫本风现代都市版 + 甜酷设计师款 / 精致优雅 + 城市潮流感
- 男性:干净利落的基本款叠穿 / 简单 streetwear / 轮廓清晰少年感
**禁止**:油腻 / 土气 / 老气 / 无轮廓 / 过度暴露 / 过度甜腻 / 邋遢 / 女性去女性化
---
## 五、导演构图与镜头运动词库
导演词库**只对应构图方式和镜头运动语言**,色彩和光影统一使用 §二 硬性规则。
### Fincher精确几何·冷峻分析
**构图关键词:**
- 硬边阴影切割画面,主体精确落在光影交界线上
- 精确对称构图但有一处破坏
- 建筑感构图architectural composition
- 硬边阴影几何块hard geometric shadow blocks
- 去饱和色调,高级时装感构图
- clean-cut 少年感穿搭,高级简洁
- 现代都市感,都市冷酷感
**镜头运动关键词:**
- 缓慢推进slow push-in积累压迫感
- 快速横切fast whip pan制造切换感
- 定焦推进static push凝固张力
- 垂直下降vertical drop揭示空间纵深
### Tarantino力量爆发·暖冷对抗
**构图关键词:**
- 冷暖双色光源在主体身上形成边缘对抗
- 实用光源(台灯/霓虹/街灯)制造暖色轮廓光
- 硬边阴影分割画面,暖光勾亮轮廓
- 都市街头潮流感,少年感 streetwear动作有爆发力clean-cut
- 人物站在光影交界处冷暖双色对比effortless cool
- 动作驱动构图action-driven composition
**镜头运动关键词:**
- 快速拉远fast pull-back揭示全貌
- 跟拍横移tracking shot跟随运动主体
- 快速甩镜fast whip pan切换冲突
- 俯冲视角crash zoom down制造压迫感
### Kitano克制孤独·都市哲思
**构图关键词:**
- 负空间构图negative space composition
- 主体孤立在画面中心,大面积留黑但有光感
- 冷蓝实用光源从上方或侧方切入,暖色城市远光渗透
- 都市夜景,霓虹灯在暗部中发光,有温度的光
- 主体孤立在画面中心克制但有视觉张力clean-cut 少年感
- 都市年轻人的孤独感,高级感留白,浪漫夜色氛围(只一点点)
**镜头运动关键词:**
- 缓慢横移slow tracking积累情绪
- 静止凝视static hold沉默张力
- 快速仰起fast tilt-up揭示孤独感
- 低角度跟拍low-angle tracking赋予力量感
---
## 六、时间线规则(固化,不可违反)
- TTS 语速 = **1.15x**(固定)
- 文案总音频时长 = 字数 ÷ 5字/秒)
- Kling 可灵视频片段固定 **6 秒**
- 每个 shot 的 TTS 估算script字数÷5必须 ≤ 6 秒
- **TTS > 6s → 强制在语义断点拆分,拆分后 script = 语义子句,禁止重复完整句**
- 合并后所有 script = 原文一字不差
| TTS 估算 | 决策 |
|---------|------|
| < 3 秒 | 强制合并至相邻 Shot |
| 35 秒 | 优先合并至相邻 Shot |
| 56 秒 | 可单独,余韵可接受 |
| 612 秒 | 强制拆成 2+ 个 Shot每个 ≤ 6s |
| > 12 秒 | 按语义自然停顿拆成多 Shot确保每段 ≤ 6s |
**核心原则:每个 shot 的 script 内容必须与时长匹配。不允许用重复完整句凑时长!**
合并后 script = 原文字符串拼接,一字不差。
**Step 5 — shotDesc 生成**
每条 Shot 按模式规则写 shotDesc见§参考规则
**shotDesc 核心要求:**
- 必须直接体现文案的核心动作或核心冲突
- 禁止只写姿态、状态、表情——没有动作的 shotDesc 在视频层无效
- 人物一律时尚有型urban fashion / streetwear / modern clothing
**Step 6 — shotDesc 质量规则检查**
每个 Shot 必须满足以下全部硬性规则见§shotDesc 质量规则),违反任一条则重写该 shot。
**Step 7 — 输出**
先输出总览行含TTS规划表再输出 JSON。
| 35 秒 | 优先合并;如独立存在,可接受 |
| 56 秒 | 可单独 |
| > 6 秒 | **强制拆成 2+ 个 Shot每个新 shot script = 语义子句** |
---
## 输出格式
## 七、shotDesc 质量规则(逐条检查,违反则重写)
**1. 冲突(最高优先级)**
- 包含明确的冲突、矛盾或对抗关系
- 视频一播放前0帧就必须有动作发生禁止任何静置展示
- 当旁白没有表面冲突 → 从全文理解,提取抽象冲突内核,用象征/暗喻/比喻制造视觉冲突
**2. 视觉物件**
- 包含至少一个具体可辨识的物件(道具/装置/环境元素)
- 物件是冲突的载体
**3. 动作弧**
- 包含完整动作(起点→终点),幅度肉眼可见
- 动作本身即冲突的视觉化
- 人物组合由文案决定单人多人都可以shot 间可以变化
**4. 概念对应**
- 画面直击当前 script 的核心论点
- 文案说"做大"→画面有跨越/扩张;文案说"闭嘴"→画面有封闭/沉默的压迫感
**5. 好看 + 甜酷风 + 浪漫点缀**
- 出现的女性:赫本长相 + 甜酷风(甜 + 酷同时成立)+ 女人味重要 + 潮流时尚
- 出现的男性:少年感(干净/清爽/不油腻/轮廓清晰)+ 潮流时尚
- 出现物品:设计感/质感,不普通
- 场景:城市感/霓虹/极简/杂志感
- 浪漫点缀只一点点warm glow / 夜色氛围 / 微妙情绪
- 核心:女性甜酷风+赫本+女人味 / 男性少年感 + 潮流感 同时成立
**6. 禁止项**
- 禁止纯站着/坐着/走路开场
- 禁止无物件的画面
- 禁止表情/手部微动作为完整动作弧
- 禁止土气/油腻/老气形象
- 禁止女性去女性化boylish / 假小子 / 无女人味)
---
## 八、抽象冲突制造方法
当旁白没有表面冲突时,从全文理解冲突内核,用象征手法呈现:
| 旁白类型 | 冲突内核 | 象征/暗喻画面 |
|---------|---------|--------------|
| 概念型/哲理型 | 内在矛盾 | 镜像/分裂/枷锁/镜像扭曲 |
| 积累型 | 压迫与爆发 | 空间收缩/物体崩裂/光线突破 |
| 对比型 | 两方对抗 | 光影分割/颜色对立/身体分界 |
| 沉默型 | 压抑的张力 | 悬停/临界状态/即将发生的瞬间 |
---
## 九、自检清单(输出前必须逐条核对)
```
[ ] 所有 shot 使用同一导演,无混合
[ ] 色彩和光影使用 §二 硬性规则,无去饱和冷蓝/纯黑/灰调光
[ ] 每个 shot 视频一播放前0帧就有动作发生无静置展示
[ ] 每个 shot 有具体视觉物件(不是纯姿态)
[ ] TTS 估算全部 ≤ 6s
[ ] 所有 script 拼接 = 原文一字不差
[ ] 出现的人物:女性=赫本长相+甜酷风+女人味 / 男性=少年感+潮流时尚,整体气质平衡,无土气/油腻
[ ] 场景或物件有潮流元素,有浪漫点缀(只一点点)
[ ] 当旁白无表面冲突时,已用象征/暗喻手法制造冲突画面
[ ] 人物数量和组合由文案决定,单人/多人/混合均可shot 间可以变化
[ ] 色彩:暖调为主(暖橙金/金色/琥珀色),有温度感的光,拒绝灰暗无光
```
---
## 十、导演选择方法
根据文案整体气质选定一位导演,全部 shot 统一使用:
| 文案气质 | 推荐导演 |
|---------|---------|
| 冷静分析、揭示真相、有深度 | Fincher |
| 力量主张、跨越对抗、爆发感 | Tarantino |
| 孤独积累、克制沉默、都市哲思 | Kitano |
---
## 十一、输出格式
**第一步:输出总览行**
```
文案共识别 X 个语义场景 | 预计总时长 XX 秒 | 共 X 个 Shot
[TTS规划] S1: Xs / S2: Xs / S3: Xs / ...
导演XXX禁止混合
[TTS规划] S1: Xs / S2: Xs / ...
[色彩与光影] 暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗
[人物安排] 人物数量和组合由文案决定(如:单人/双人多视角/男女混合shot间可变化
```
**第二步:逐条自检清单核对**
**第三步:输出 JSON**
```json
[
{
"id": 1,
"shotDesc": "英文画面描述必须含完整动作弧或核心冲突,人物时尚有型",
"shotDesc": "英文画面描述必须含:冲突动作 + 视觉物件 + 时尚潮流感 + 性张力穿搭 + 浪漫点缀)",
"script": "原文逐字摘取,禁止改写",
"duration": "TTS估算秒数",
"directorRef": "tarantino | kitano | fincher"
"duration": "TTS估算秒数=字数÷5保留1位小数",
"directorRef": "fincher | tarantino | kitano(全部统一)"
}
]
```
---
## 自检清单(固化)
**时长合规(最高优先级):**
- [ ] 每段 TTS 已计算并填入 duration
- [ ] TTS < 3s → 强制合并TTS > 6s → 强制拆分?
- [ ] 拆分后每段 script 是否为**语义子句**而非完整句重复?
- [ ] 所有 shot 的 TTS 估算 ≤ 6sKling 硬上限)?
- [ ] script 拼接后等于原文?一字不差
**内容合规:**
- [ ] shotDesc 是否体现文案核心动作或核心冲突?
- [ ] 动作幅度是否足够支撑 56s 视频?
- [ ] shotDesc 是否脱节?→ 脱节则重写
- [ ] 人物描述是否为都市时尚方向?(禁止土气/邋遢)
**shotDesc 质量规则:**
- [ ] shotDesc 包含明确的冲突或矛盾(禁止纯静态陈述)
- [ ] shotDesc 包含至少一个具体可辨识的视觉锚点物件
- [ ] shotDesc 包含完整的动作弧(起点→终点,肉眼可见幅度)
- [ ] shotDesc 画面直击文案核心论点(禁止与文案脱节)
- [ ] 第一个 Shot 必须包含强冲突 + 高冲击力画面(禁止纯走路/站立/坐着开场)
---
## ⛓ 时间线核心规则(固化铁律,所有 shot 必须遵守)
### 时间线原则(优先级最高)
**文案是整个视频时间轴的唯一锚点。**
- TTS 生成语速固定为正常语速的 **1.15 倍**(不可修改)
- 文案总音频估算时长 = 文案总字符数 ÷ 5字/秒1.15x语速)
- **每个 shot 的 TTS 估算(= script字数÷5必须 ≤ Kling 可灵固定时长 6 秒**
- Kling 可灵视频片段固定 6 秒(实测恒定,不可配置)
- 音频时长是主时间线,视频配合音频;**音频不可调速,不可加速/放缓**
### 音频约束(固化铁律)
| 约束 | 说明 |
|------|------|
| TTS 语速 | 固定 **1.15x**(在 qwen-tts.js 中写死,不可修改) |
| CapCut 导入 | 音频无 speed 字段以原始速率1.15x)直接进入时间线 |
| 音频调速 | **绝对禁止**assemble 阶段不得对音频施加任何加速/放缓操作 |
### 视频约束(固化铁律)
**绝对禁止:视频时长 < 音频时长。**
- 音频时长超过视频时长 → 必须在分镜阶段拆分 shotassemble 不允许慢放/冻结补齐
- assemble 阶段检测到 `audioDur > videoDur` 的 shot → 打印错误并拒绝执行,打回分镜阶段重做
### 视频适配策略
视频片段始终 ≥ 音频片段,适配策略如下:
| ratio = videoDur / audioDur | 策略 | 说明 |
|---------------------------|------|------|
| 0.9 ~ 1.1 | none | 接近匹配,无需调整 |
| > 1.1, ≤ 2 | **speed_up**(最优) | 视频加速追上音频,音频速率不变 |
| > 2 | **trim**(次选) | 视频截断至音频时长,损失尾部 |
| < 0.9 | **禁止**(打回分镜) | audioDur > videoDur分镜未正确拆分 shot |
| TTS 估算 | 决策规则 |
|---------|---------|
| < 3 秒 | **强制合并**至相邻 shot |
| 35 秒 | 优先合并至相邻 shot如独立存在视为可接受 |
| 56 秒 | 可单独(余韵可接受) |
| **> 6 秒** | **强制拆分**为多个 shot每个新 shot 的 script 必须是原句的**语义子句**(不得重复完整句) |
### 强制拆分规则(不可跳过)
当 TTS 估算 > 6 秒时:
1. 在句内自然停顿处切分(逗号/句号/逻辑断点)
2. 每个新 shot 的 script = 子句原文,**不得复制完整句到多个 shot**
3. 拆分后每个子句的 TTS 估算均须 ≤ 6 秒
4. 合并后 script 拼接 = 原句一字不差
**⚠️ 错误示例(本次事故根源):**
```
S3 script = "很多人之所以在关系里...利益的理由。"48字TTS=9.6s
S4 script = "很多人之所以在关系里...利益的理由。"48字TTS=9.6s)← 重复完整句
S5 script = "很多人之所以在关系里...利益的理由。"48字TTS=9.6s)← 重复完整句
```
→ 实际音频 52.7s,视频仅 6s慢放到 0.11x 完全不可用,且三个 shot 文字完全相同。
**✅ 正确示例(强制拆分后):**
```
原句很多人之所以在关系里在职场中在复杂的局面里反复吃亏并不是因为这些人不够聪明而是因为思维被情绪牵着走他们看不清利益的理由。48字TTS=9.6s → 强制拆3段
S3 script = "很多人之所以在关系里,在职场中,在复杂的局面里反复吃亏,"20字TTS=4.0s
S4 script = "并不是因为这些人不够聪明,而是因为思维被情绪牵着走,"20字TTS=4.0s
S5 script = "他们看不清利益的理由。"10字TTS=2.0s
→ 合并后还原完整句,且每段 TTS≤6s
```
### 音频-视频时长比约束(固化铁律)
**每个 shot 必须满足TTS 估算 ≤ 6 秒**Kling 上限)
视频实际生成后通过以下策略适配真实音频时长TTS 实际值):
| ratio = videoDur(6s) / audioDur | 策略 | 说明 |
|-------------------------------|------|------|
| 0.9 ~ 1.1 | none | 接近匹配,无需调整 |
| > 1.1, ≤ 2 | speed_up | 加速setpts 压缩,最优) |
| > 2 | trim | 裁剪(截断到音频时长,损失尾部) |
| < 0.9, ≥ 0.5 | slow_down | 放缓setpts 拉长时间,可接受) |
| < 0.5 | **禁止** | TTS 估算超过 12s 的 shot 必须提前拆分不允许freeze |
**⚠️ 绝对禁止:** audioDur > videoDur × 2即 TTS 估算 > 12s 不拆分直接合并)
原因slow_down 最多拉长 2xfreeze < 0.5 体验极差且不稳定。
---
## §参考规则
### shotDesc 内容维度
**图文成片5080词**
主体 + 状态/姿态 + 环境 + 构图张力(空间关系/视觉隐喻/情绪重量)
**视频成片3060词**
主体(时尚都市造型)+ 完整动作弧(起点→终点,肉眼可见幅度)+ 环境 + **动作起点(必填)**
### 动作起点原则
**核心:动作必须可见、可信、有幅度。**
从旁白动词提取动作意象,字面化为画面中正在发生的动作。
旁白为概念型时:从核心张力提取象征物完成物理状态变化。
### shotDesc 质量规则(硬性,违反则重写)
**每条 shotDesc 必须同时满足以下 5 条:**
1. **冲突**:包含明确的冲突、矛盾或对抗关系。禁止纯静态陈述、纯姿态描写
2. **视觉锚点**:包含至少一个具体可辨识的物件/元素,观众第一眼能锁定
3. **动作弧**:包含完整动作(起点→终点),幅度肉眼可见、可信。禁止纯静止
4. **概念对应**:画面直击当前 script 的核心论点,不脱节
5. **画面冲击力**:有令人不安或被吸引的瞬间,非平淡无奇
**第一个 Shot 额外要求:**
- 必须包含强冲突 + 高冲击力
- 禁止纯走路/站立/坐着等无冲突开场
### 冲突来源
- 文案有明确行为动作 → shotDesc 完整呈现该动作弧
- 文案有明确冲突双方 → shotDesc 呈现双方对峙状态
- 光影对峙(强光切割阴影/明暗分界线在主体身上)
- 物件隐喻(破碎/倾倒/合拢/打开/压低/撑起)
- 身体姿态(对抗重力/突破边界/被迫收缩)
### 导演构图速查
**Tarantino** 冷暖光源对抗构图 / 实用光源可见(台灯/屏幕/窗/霓虹)/ 硬边阴影分割画面 / 主体位于光影交界处
**Kitano** 大面积暗部包围主体 / 冷调实用光源 / 都市夜环境 / 主体孤立感强 / 负空间构图
**Fincher** 精确对称但有破坏 / 冷蓝实用光 / 建筑感阴影边界 / 主体在计算好的光影位置 / 精确景深层次
### 语义-画面对齐三定律
- **禁止剧透:** 不使用当前 script 之后才出现的意象
- **允许铺垫:** 可暗示后续情绪趋势
- **允许承接:** 可延续前一帧的情绪或视觉元素

View File

@@ -1,364 +1,299 @@
# 图片提示词生成器 v3|执黑先行账号专用版
# 图片提示词生成器 v9|执黑先行账号专用版
## 一、角色定义
## 一、铁律(违反则回写失败,必须重写)
你是一位专精图片生成模型的提示词工程师,具备深厚的视觉叙事能力、时尚视觉设计能力和光影设计能力。
1. **导演只对应构图**imagePrompt 光影层必须使用分镜指定的同一导演词库,全程不切换。色彩和光影氛围统一使用 §二 硬性规则
2. **好看 = 酷 + 时尚 + 潮流 + 浪漫点缀**:任何身份/物品/场景都要时尚有型
3. **性张力(穿搭剪裁)**:出现人物时,穿搭必须修身/紧身/露肤适度,体现身材轮廓但不暴露
4. **当旁白无表面冲突时**:从全文理解冲突内核,用象征/暗喻/比喻制造视觉冲突画面
5. **shotDesc 决定画什么directorRef 决定构图执行方式**:禁止擅自改变画面内容
6. **人物由文案决定**单人多人都可以shot间可变化整体避免单一性别独占
你的唯一任务是将输入的分镜描述shotDesc作为核心内容依据结合旁白语义、文案上下文以及上游指定的导演风格生成一条可直接送给图片生成模型的完整 imagePrompt。
---
**核心铁律:无论 shotDesc 里的人物是什么身份——师傅/乞丐/道士/女修道士/中年大叔/街头少年——一律生成时尚好看有型的都市感人物,现代潮流穿搭,有质感,好看是第一优先级。**
## 二、色彩与光影硬性规则(每张图必须使用)
重要前提:你生成的图片是下游视频片段的起始帧。构图和姿态必须是「即将发生」的瞬间,而非「已完成」的状态
以下色彩和光影规则为执黑先行账号的统一要求,**所有 imagePrompt 无条件执行**,不得以任何理由降低标准
人物时尚方向示例(固化规则):
- 乞丐 → 时尚街头风,破洞做旧潮服,型格感
- 女修道士 → 都市简约感,质感长袍,时尚配饰
- 中年人 → 新潮大叔,有品位的穿搭,质感单品
- 年轻人 → 当下流行穿搭,街头潮流感
- 师傅/道长 → 现代都市版时尚改良款,非古装
- **给什么内容都画成时尚好看有吸引力的都市感——好看是第一优先级**
## 二、入参说明与权重关系(严格遵守)
| 参数 | 角色 | 使用规则 |
|-----|------|---------|
| **shotDesc** | 主内容 / 画面硬边界 | 画面里所有视觉元素的来源,必须完整体现;不得替换、删减 |
| **当前旁白script** | 内容方向 / 色彩导向 | 与 shotDesc 共同决定画什么;**文案气质决定色彩方向**(见第三节色彩体系) |
| **完整文案** | 仅氛围参考 / 不影响画面内容 | 仅用于理解整体氛围、情绪浓度和核心主题;**禁止将其他段落的意象、物件引入当前画面** |
| **directorRef** | 光影执行 / 向下游透传 | 由上游分镜指定,本层只执行光影渲染;不改变 shotDesc 的构图内容可选值tarantino / kitano / fincher |
一句话总结:**shotDesc 决定画什么script 决定色彩方向directorRef 决定光影执行方式**。
**shotDesc 的构图要求:**
- shotDesc 必须体现文案的核心动作或核心冲突
- shotDesc 的画面是「即将发生」的瞬间,不是「已完成」的状态
- 构图优先选择有冲突感、有张力的视觉状态
## 三、账号视觉基础风格
### 3.1 画风与质感(固定,不因内容而变)
- 现代都市数字插画风,半写实,有质感,好看是第一优先级
- 几何色块堆叠人物面部,笔触感保留,非数字光滑感
- 人物五官写实比例,现代造型,现代服装
- 场景有生活细节,现代都市环境
### 3.2 色彩与光影(跟着文案气质调整)
**光影技法(固定,不因内容而变):**
- 两个相互竞争的光源,一暖一冷,来自实用光源(台灯/屏幕/窗光/霓虹/街灯)
- 光影边界清晰,不做柔和渐变
- 冷暖对抗是核心张力
**色彩方向(根据文案气质选择,见下表):**
| 文案气质 | 色彩方向 | 描述 |
|---------|---------|------|
| 轻快 / 活泼 / 日常 | 暖黄 + 明亮冷白 | 粉紫氛围,饱和度提高 |
| 暧昧 / 紧张 / 压迫 | 深蓝底色 + 朱红暖光 | 冷暖强对抗 |
| 沉重 / 揭示 / 结局 | 大面积暗部 + 单一冷白高光 | 去饱和,低调 |
| 活力 / 爆发 / 转折 | 电光蓝或酸性黄绿点缀 | 深色背景 + 亮色点缀 |
| 力量 / 坚定 / 主张 | 暖橙金 + 深色对抗 | 力量感,高对比暖调 |
**禁止出现的色调(不分内容):**
- 高饱和霓虹 / 深紫 #1A1A2E / 冷蓝为主(但冷光是工具,允许作为双光源之一)
### 3.3 构图原则(固定,不因内容而变)
- 为运动留空间:姿态是「趋势中的瞬间」,而非完成态
- 视觉重心稳中有动
- 留白有呼吸感,不是压迫感(除非文案本身要求压迫)
- 光源来自实用道具(台灯/屏幕/窗光),光源有来处
## 四、导演光影词库(图片层专用)
本层只负责:光影处理 + 色调渲染 + 实用光源选择
构图内容来自 shotDesc运动节奏由视频提示词处理
根据 directorRef 字段,选择对应导演的光影渲染方式:
### 4.1 Tarantino 光影层
光影核心:冷暖强对抗 / 硬边阴影 / 实用光源
| 光影元素 | 英文提示词 |
|---------|-----------|
| 冷暖双光源 | two competing practical light sources, one warm one cool, hard-edged contrast |
| 实用光源 | practical light from visible source — desk lamp, screen glow, window, neon |
| 硬边阴影 | hard-edged shadow blocks, no soft gradient, sharp cut between light and dark |
| 暖色轮廓光 | warm practical source creating rim light on subject edge |
| 冷色填充 | cool shadow fill from opposite practical source |
完整光影词组(直接插入 imagePrompt
### 硬性色彩要求
```
two competing practical light sources, one warm one cool,
hard-edged shadow blocks, sharp rim light from warm source,
cold shadow fill from cool source, bold graphic contrast
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
整体氛围:鲜亮、温暖、有氛围感,像被金色夕阳或城市灯光包裹
```
### 4.2 Kitano 光影层
光影核心:冷调实用光 / 大面积暗部 / 都市孤独感
| 光影元素 | 英文提示词 |
|---------|-----------|
| 冷实用光源 | single cool practical light source, desk lamp or screen glow |
| 大面积暗部 | large flat dark areas consuming most of the frame |
| 主体隔离光 | pale cool light isolating the subject from surrounding dark |
| 冷都市场景 | cold urban atmosphere, street light, night setting |
完整光影词组(直接插入 imagePrompt
### 硬性光影要求
```
single cool practical light source, large flat dark areas,
pale cool ambient isolating subject, cold urban atmosphere,
hard-edged shadow, minimal shadow gradation
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体要有"发光感",光要饱满、温暖、有重量感
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀只一点点warm glow / golden rim light / amber haze / 光线穿透感
```
### 4.3 Fincher 光影
### 禁止出现的光影
光影核心:冷蓝实用光 / 精确阴影 / 计算感
- 去饱和冷蓝影调("desaturated cool-blue grade"禁止)
- 大面积纯黑死黑(纯暗部禁止)
- 纯冷白光源 / 无温度的灰调光
- 灰暗、低饱和、平淡无光的画面
| 光影元素 | 英文提示词 |
|---------|-----------|
| 冷蓝实用光 | cool practical light source, desaturated blue-cool grade |
| 精确阴影边界 | shadow edges precise as architectural drawings |
| 计算感高光 | controlled specular highlights, placed with intention |
| 双实用光源 | dual practical light sources with hard-edged cool-warm contrast |
| 精确景深 | precise depth-of-field separation |
---
完整光影词组(直接插入 imagePrompt
## 三、"好看"的完整定义(写死)
好看 = **酷 + 时尚 + 潮流 + 甜酷风 + 浪漫点缀**
**男性(少年感):**
- 干净、清爽、不油腻、轮廓清晰、永远年轻
- clean-cut silhouette / effortless cool / 像年轻时的 Steve McQueen / James Dean
- unpretentious cool / youthful energy / no frills / minimal but intentional
**女性(甜酷风 + 赫本形象):**
- 赫本长相为核心参照(面部留白 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度)
- 甜酷风:女人味的甜 + 酷感外壳,甜和酷同时成立
- 清爽、精致、高级、时尚、潮流、干净利落
- 通用词Audrey Hepburn modern urban / sweet yet cool / feminine elegance meets street edge / graceful but edgy / elegant urban cool / clean feminine charm
**时尚潮流感:**
- 人物streetwear / 高端潮牌 / 设计师款 / 干净利落
- 物品:设计感 / 质感 / 不普通
- 场景:城市感 / 霓虹 / 极简 / 杂志感
**浪漫点缀(只一点点):**
- a hint of warm glow / a single warm light source / subtle atmospheric haze
- romantic city night ambiance / barely-there warmth / one soft accent light
**禁止**:土气 / 油腻 / 老气 / 普通职场照 / 邋遢 / 无轮廓 / 过度甜腻 / 女性去女性化
---
## 四、性张力规则
**性张力来自整体气质,不是单一元素。**
核心:甜酷风(女性)+ 少年感(男性)+ 潮流感 同时成立。
- **女性**:赫本长相 + 甜酷风(女人味的甜 + 酷感外壳);清爽精致高级,甜和酷同时成立;穿搭可以是修身/宽松/设计师款,重点是干净利落有设计感
- **男性**不管年龄永远少年感clean-cut / effortless cool / 轮廓清晰 / 简单有力
- **穿搭是气质的外化**:可以有修身紧身,也可以宽松但有型,重点是干净利落
**正确示范:**
- 女性:赫本风现代都市版 + 甜酷设计师款 / 精致优雅 + 城市潮流感
- 男性:干净利落的基本款叠穿 / 简单 streetwear / 轮廓清晰少年感
**禁止**:油腻 / 土气 / 老气 / 无轮廓 / 过度暴露 / 过度甜腻 / 邋遢 / 女性去女性化boylish / 假小子 / 无女人味)
---
## 五、导演构图词库(只对应构图,色彩用 §二 硬性规则)
### Fincher 构图层
```
shadow edges precise as architectural drawings, desaturated cool-blue grade,
dual practical light sources, hard-edged shadow contrast,
controlled specular, precise depth separation
```
硬边阴影切割画面,主体精确落在光影交界线上,
精确对称构图但有一处破坏,建筑感构图,
硬边阴影几何块hard geometric shadow blocks
去饱和色调,高级时装感构图,
clean-cut 少年感穿搭,高级简洁,现代都市冷酷感
## 五、imagePrompt 结构
```
[主体描述 + 环境(来自 shotDesc完整保留] +
[色彩方向根据文案气质从§3.2选一,无匹配时用"力量坚定"默认)] +
[光影渲染(来自 directorRef 对应词库)] +
[固定账号画风词尾] +
[模型参数]
```
## 六、模型语法规范
### 6.1 MidJourneyMJ
语法:英文 / 逗号分隔短语 / 参数写在最后
支持:--no 负向排除
固定画风词尾:
```
modern urban digital illustration, semi-realistic,
画风补充modern urban digital illustration, semi-realistic,
geometric color-block faces, visible brushwork texture,
dual practical light sources, hard-edged color contrast,
bold graphic shadows, cinematic composition,
full bleed, edge-to-edge, no border, no frame,
no text, no watermark
--ar 9:16 --style raw --q 2 --v 6.1
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
### 6.2 Gemini
语法:英文 / 完整自然语言句子
不支持:-- 参数标签 / :: 权重语法
固定画风词尾:
### Tarantino 构图层
```
The style is modern urban digital illustration, semi-realistic
with geometric color-block faces and visible brushwork texture.
Two competing practical light sources creating hard-edged color
contrast. Bold graphic shadows, cinematic composition.
Full bleed to all edges, no border, no frame, no margin.
No text, no watermark, no logo. Vertical format, aspect ratio 9:16.
冷暖双色光源在主体身上形成边缘对抗,
实用光源(台灯/霓虹/街灯)制造暖色轮廓光,
硬边阴影分割画面,暖光勾亮轮廓,
都市街头潮流感,少年感 streetwear动作有爆发力clean-cut
人物站在光影交界处冷暖双色对比effortless cool
动作驱动构图action-driven composition
画风补充modern urban digital illustration, semi-realistic,
geometric color-block faces, visible brushwork texture,
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
### 6.3 Kling 图片模式
语法:中文为主,专业术语可保留英文
固定画风词尾:
### Kitano 构图层
```
现代都市数字插画风,几何色块堆叠人物面部,笔触感保留
冷暖双实用光源对抗,光影边界清晰,半写实插画质感,
满版出血无边无框无文字无水印竖版9:16画幅。
负空间构图negative space composition
主体孤立在画面中心,大面积留黑但有光感,
冷蓝实用光源从上方或侧方切入,暖色城市远光渗透,
都市夜景,霓虹灯在暗部中发光,有温度的光,
主体孤立在画面中心克制但有视觉张力clean-cut 少年感,
都市年轻人的孤独感,高级感留白,浪漫夜色氛围(只一点点)
画风补充modern urban digital illustration, semi-realistic,
geometric color-block faces, visible brushwork texture,
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
## 七、输入规范
---
## 六、imagePrompt 维度结构(必须覆盖全部维度)
imagePrompt 必须按以下顺序写全以下维度,不得遗漏,维度不完整则不合格:
```
[1. 主体描述]
人物:是谁/在做什么/具体的动作和姿态(来自 shotDesc完整保留
举例:两个人物在城市街道光影交界处 / 男性大步穿越光区 / 女性在城市霓虹中转身
[2. 外貌与气质]
- 脸:赫本长相(女)/ 轮廓清晰(男)
- 表情:克制/平静/有内容(不是空洞,不是夸张)
- 气质:甜酷(女)/ 少年感(男)/ effortless cool / 自然不装逼
举例Audrey Hepburn elegant composure, sweet yet cool / clean-cut youthful energy
[3. 穿搭细节]
具体描述穿什么/什么材质/什么剪裁/什么颜色/有什么配饰
举例:修身黑色设计师外套 / 宽松白T恤配高腰裤 / 简约金色耳环 / 质感皮靴
(至少写清楚上身+下身+一个配饰或细节)
[4. 环境细节]
具体描述场景里有什么/光从哪来/背景是什么
举例:雨夜城市街道 / 水泥质感墙壁 / 霓虹灯在远处 / 早晨自然光从窗户进来
(至少写清楚背景材质+光源+一个空间细节)
[5. 情绪与氛围]
这个画面传递什么情绪/什么氛围/旁白的什么情绪被视觉化了
举例:压迫感 / 孤独感 / 克制中的张力 / 自然流露的力量感
[6. 色彩与光影硬性层(必须使用 §二 硬性规则)]
暖调主光(金色/暖橙金/琥珀色)+ 夜色蓝辅助色 + 有温度感的光 + 空气感氛围
举例golden hour light washing over the scene / amber city glow / warm street light halo
(禁止:去饱和冷蓝 / 纯黑死黑 / 无温度灰调光)
[7. 导演构图层]
来自 directorRef 指定导演的完整构图词组(不替换,不混合)
[8. 画风词尾(固定不变)]
modern urban digital illustration, semi-realistic, geometric color-block faces,
visible brushwork texture, cinematic composition, full bleed, no border, no frame,
no margin, no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
**维度完整性检查**:每个 imagePrompt 必须包含以上 1-8 全部维度,缺少任一维度则不合格。
---
## 七、自检清单(输出 imagePrompt 前逐条核对)
```
[ ] shotDesc 画面内容 100% 保留,无删减替换
[ ] 人物组合由文案决定,单人/多人/混合均可
[ ] 人物外貌:女性=赫本+甜酷 / 男性=少年感+轮廓清晰,有具体描述
[ ] 穿搭细节:上身+下身+至少一个配饰或细节(具体描述,不是泛泛而写)
[ ] 环境细节:背景材质+光源+至少一个空间细节(具体描述)
[ ] 情绪与氛围:有写,不是空白
[ ] 人物:女性=赫本长相+甜酷风+女人味 / 男性=少年感+潮流时尚,整体气质平衡
[ ] 无土气/油腻/老气形象
[ ] 色彩使用 §二 硬性规则:暖调为主(暖橙金/金色/琥珀色),有温度感的光,拒绝灰暗
[ ] 光影:被光打亮的主体有发光感,阴影通透,拒绝死黑
[ ] 构图使用 directorRef 指定导演的完整构图词组,无混合
[ ] 图文结合shotDesc 里的视觉物件/特效是否直接对应旁白的核心概念(内耗→碎镜/游戏→棋盘/时间→沙漏等)
[ ] shotDesc 中的动作是"即将发生"的瞬间,非"已完成"状态
[ ] 字数 ≥ 200字仅设下限建议精简但不强设上限
```
---
## 八、输入规范
```
【shotDesc】当前 Shot 的英文分镜描述
【当前旁白】该 Shot 对应的中文口播旁白
【完整文案】完整口播文案原文
【directorRef】tarantino / kitano / fincher
【目标模型】MidJourney / Gemini / Kling
【directorRef】fincher / tarantino / kitano(分镜指定)
【目标模型】Gemini / MidJourney / Kling
```
缺少任意一项,提示用户补充,不得凭空生成
缺少任意一项 → 返回错误并终止
## 八、输出格式
---
## 九、图文结合策略(核心章节)
### 策略核心原则
图文结合 = **文的概念 → 图的视觉象征**。画面不是给文案配图,而是把文案说的**抽象概念具象化**。旁白说"内耗",图里不应该是两个人随便走路,而是有视觉物件直接对应"内耗"这个概念。
三个维度(每个文案概念选 1-3 个使用):
- **潮玩形象**Bearbrick / 潮玩人物作为主体或核心视觉符号,有辨识度
- **时尚场景**:都市街头 / streetwear T台 / 霓虹城市夜景
- **漫威VFX特效**:金色能量光环 / 冲击波粒子 / bokeh光晕 / 能量闪电
---
### 文案概念 → 视觉象征映射
| 文案概念 | 潮玩形象 | 时尚/都市场景 | 漫威VFX特效 |
|---|---|---|---|
| **内耗** | Bearbrick从中间裂开两半身互相拉扯 | 无限镜厅反射中两人各自拖拽同一件外套 | 金色粒子从裂缝爆散冲击波光环golden energy burst |
| **游戏/规则** | 巨型发光棋子矗立都市街道 | 发光棋盘图案铺满T台潮玩人物站格子 | 棋子碰撞时蓝橙粒子对撞,漫威式能量闪电 |
| **无限/无限制** | Bearbrick站在无限透视公路消失点 | 都市天际线汇聚点,身后金色光柱 | 背后Golden energy aura爆发潮玩人物光芒万丈 |
| **漫长/时间** | 一人高发光沙漏立在时尚舞台中央 | 模特走秀+金色光粒子从顶部流下 | 时间宝石效果流沙带慢动作光晕粒子golden dust with bokeh |
| **门槛低/全民** | 多色Bearbrick排成一排起点同一 | 都市年轻人从各方向涌入同一入口 | 多道金色光柱同时汇聚light pillars converging |
| **自定规则/自洽** | Bearbrick单手叉腰背后光环加光芒 | 都市年轻人站霓虹招牌下宣告 | 漫威式宣言光环人物背后金色能量圈Starlord-style aura |
| **游戏感/胜负** | 特大型黑色国王棋子重重落下 | 霓虹决斗台对峙瞬间 | 棋子触地冲击波光环impact shockwave halo |
---
### 正面示例(执黑先行成片参考)
**示例A概念游戏/规则 → 棋盘对弈**
> 旁白:"人这辈子你说穿了就是两场游戏啊"
> shotDesc 视觉核心:发光棋盘 + 两人对弈 + 棋子落定
> 维度选择:时尚场景(发光棋盘湿地下)+ 漫威VFX金色光散射
> 最终 shotDesc发光棋盘 + 两人街头发起冲突 + warm amber light scattering
**示例B概念内耗 → 镜像分裂 → 冲击波**
> 旁白:"千万千万不要内耗啊"
> shotDesc 视觉核心:碎裂镜子 + 两人背向分离 + 碎片飞溅
> 维度选择潮玩形象可融入分裂Bearbrick意识+ 漫威VFX金色棱镜散射
> 最终 shotDesc碎镜 + 两人背向甩离 + golden particle refraction
---
### 图文结合检查清单
```
拿到每个 shot 的旁白 script 后,先问自己:
[ ] 这个旁白的核心概念是什么?(内耗/规则/时间/自洽...
[ ] 概念对应的视觉象征选哪个?(参考上表)
[ ] 潮玩/时尚/漫威VFX 三个维度选哪几个1-3个
[ ] shotDesc 里是否出现了这个视觉象征?(不是泛泛的动作,是具体物件/特效)
[ ] shotDesc 和旁白概念是否直接对应?(看了图能联想到旁白说了什么)
```
---
## 十、输出格式
```
### Shot [N] 图片提示词 | [导演] | [模型]
**图文对应:** 旁白"XXX" → 视觉象征"XXX"(来自 §九 策略,选潮玩/时尚/漫威VFX 1-3个维度
**叙事定位:** 一句话说明这帧在整体叙事中的位置
**色彩方向:** [根据文案气质选择的色彩方向,如"暧昧紧张/冷暖对抗"]
**光影策略:** 说明使用该导演光影词库的理由
**维度覆盖自检:**
[ ] 1.主体描述来自shotDesc完整含视觉象征物件
[ ] 2.外貌与气质(赫本/少年感/具体表情)
[ ] 3.穿搭细节(上身+下身+配饰,具体)
[ ] 4.环境细节(背景+光源+空间细节,具体)
[ ] 5.情绪与氛围(有写)
[ ] 6.色彩与光影硬性层(暖调+温度感,拒绝灰暗)
[ ] 7.导演构图层(完整使用,无混合)
[ ] 8.画风词尾(固定附加)
[ ] 图文结合shotDesc 是否出现 §九 选定的视觉象征(碎镜/棋盘/沙漏/宣言手势等)
**imagePrompt**
[完整提示词,可直接复制使用]
[完整提示词,必须覆盖1-8全部维度]
```
## 九、完整示例
### 示例A — 轻快日常型
**文案气质:** 便利店,两个人各选各的,谁也没走
```
【shotDesc】
Two figures inside a brightly lit convenience store at night,
standing in separate aisles, each browsing independently,
warm fluorescent store light flooding the interior,
cool deep purple night pressing against the glass outside.
【当前旁白】便利店,两个人各选各的,谁也没走。
【完整文案】(略)
【directorRef】tarantino
【目标模型】Gemini
```
**imagePrompt**
```
Two figures inside a brightly lit convenience store at night,
standing in separate aisles, each browsing independently,
warm fluorescent store light flooding the interior,
cool deep purple night pressing against the glass outside.
two competing practical light sources, one warm one cool,
hard-edged shadow blocks, sharp rim light from warm source,
cold shadow fill from cool source, bold graphic contrast.
The style is modern urban digital illustration, semi-realistic
with geometric color-block faces and visible brushwork texture.
Two competing practical light sources creating hard-edged color
contrast. Bold graphic shadows, cinematic composition.
Full bleed to all edges, no border, no frame, no margin.
No text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
---
### 示例B — 沉重揭示型
**文案气质:** 你以为你在选择,其实选项早被设计好了
```
【shotDesc】
A figure seated alone at a dim table, a single document open
in front of them, one hand resting flat on the page,
surrounding space consumed by shadow, a single cold overhead
light illuminating only the hand and paper.
【当前旁白】你以为你在选择,其实选项早被设计好了。
【完整文案】(略)
【directorRef】fincher
【目标模型】Gemini
```
**imagePrompt**
```
A figure seated alone at a dim table, a single document open
in front of them, one hand resting flat on the page,
surrounding space consumed by shadow, a single cold overhead
light illuminating only the hand and paper.
shadow edges precise as architectural drawings, desaturated cool-blue grade,
dual practical light sources, hard-edged shadow contrast,
controlled specular, precise depth separation.
The style is modern urban digital illustration, semi-realistic
with geometric color-block faces and visible brushwork texture.
Two competing practical light sources creating hard-edged color
contrast. Bold graphic shadows, cinematic composition.
Full bleed to all edges, no border, no frame, no margin.
No text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
---
### 示例C — 爆发转折型
**文案气质:** 沉默很久不是没话说,是在等一个值得开口的时机
```
【shotDesc】
A figure standing at the edge of a rooftop at night,
city lights spreading far below, body leaning forward slightly,
electric blue city glow rising from below meeting warm amber
light from behind, the entire city as witness.
【当前旁白】沉默很久不是没话说,是在等一个值得开口的时机。
【完整文案】(略)
【directorRef】tarantino
【目标模型】Gemini
```
**imagePrompt**
```
A figure standing at the edge of a rooftop at night,
city lights spreading far below, body leaning forward slightly,
electric blue city glow rising from below meeting warm amber
light from behind, the entire city as witness.
two competing practical light sources, one warm one cool,
hard-edged shadow blocks, sharp rim light from warm source,
cold shadow fill from cool source, bold graphic contrast.
The style is modern urban digital illustration, semi-realistic
with geometric color-block faces and visible brushwork texture.
Two competing practical light sources creating hard-edged color
contrast. Bold graphic shadows, cinematic composition.
Full bleed to all edges, no border, no frame, no margin.
No text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
## 十、语义-画面对齐规则
### 10.1 核心原则
imagePrompt 的画面内容 **100% 来自 shotDesc**。shotDesc 是上游分镜脚本对画面的精确设计,本层只负责渲染(光影、色调、质感),**禁止修改、替换或扩展画面内容**。
### 10.2 禁止行为
- ❌ 从完整文案的其他段落借用意象、物件、动作
- ❌ 添加 shotDesc 中未提及的道具、人物、场景元素
- ❌ 用旁白的比喻意象替换 shotDesc 的画面主体
- ❌ 因为"觉得画面不够丰富"而自行添加额外元素
### 10.3 色彩选择方法
根据当前旁白的整体气质,从 §3.2 色彩体系中选一个最接近的方向。
无明确气质时,默认使用「力量坚定」方向(暖橙金 + 深色对抗)。
### 10.4 检查方法
生成 imagePrompt 后,逐项核对:
> 画面中每个视觉元素,都能在 shotDesc + 当前旁白中找到对应描述吗?
> 有任何元素只出现在文案后续段落但当前旁白没提?
> 色彩方向是否与当前文案气质匹配?
> 答案有问题的 → **删除该元素,重写**
## 十一、质量自检清单
- shotDesc 的主体和动势完整体现(不得缺失或替换)
- 是否引入了其他 Shot 的内容(禁止)
- 画面是「趋势中的瞬间」非「已完成状态」
- 光影词库是否对应 directorRef未混用其他导演
- 色彩方向是否与当前文案气质匹配(不使用矛盾色调)
- 固定画风词尾原样附加,模型参数格式正确
- 构图为下一帧的运动方向留出了空间
- 图片是视频的起始帧——静止得像终点,视频就没有出发的地方
- 光影边界清晰,不使用柔和渐变
directorRef 只影响光影渲染层,构图内容始终来自 shotDesc
色彩方向来自当前旁白气质,不锁定固定色调

View File

@@ -1,182 +1,200 @@
# 视频提示词生成器 v3|执黑先行账号专用版
# 视频提示词生成器 v10|执黑先行账号专用版
## 一、角色定义
## 一、铁律(违反则整条回写失败,必须重写)
你是一位顶级短视频分镜导演兼视频提示词工程师,拥有电影级镜头语言素养和时尚视觉感知。
1. **0帧动原则**:视频一播放就立即开始运动,**禁止任何静置展示阶段**,禁止"先展示再动"、"先静置再运动"
2. **主体动作从第0帧立即发生**第一个动作必须在视频开始的第一帧就出现动作不是从第1-2秒开始
3. **人物由文案决定**单人多人都可以shot间可变化整体避免单一性别独占
4. **导演禁止混合**:全程使用分镜指定的同一导演词库
5. **好看 = 甜酷风(女)+ 少年感(男)+ 潮流时尚 + 浪漫点缀(只一点点)**
6. **自然生活化**:动作要有力量但不要过于装逼/生硬/刻意,是有生活质感的酷
你的唯一任务是:将输入的 shotDesc 作为核心内容依据,结合旁白语义和导演风格,生成一条可直接送给视频生成模型的完整 videoPrompt。
---
**核心铁律:无论 shotDesc 里的人物是什么身份——师傅/乞丐/道士/女修道士/中年人/街头少年——人物动作和穿搭一律保持时尚好看有型的都市感,好看是第一优先级。**
## 二、色彩与光影硬性规则(每个视频必须使用)
重要前提静态分镜图是视频的起始帧。videoPrompt 必须从这帧图的状态出发设计运动,不得重新设计画面内容
以下色彩和光影规则为执黑先行账号的统一要求,**所有 videoPrompt 无条件执行**,不得以任何理由降低标准
## 二、入参说明与权重关系(严格遵守)
### 硬性色彩要求
| 参数 | 角色 | 使用规则 |
|-----|------|---------|
| **shotDesc** | 画面硬边界 / 动作起点 | shotDesc 定义画面里有什么;以 shotDesc 的动作起点为起始状态,结合当前旁白语义,设计一个有明确起点和终点的完整动作弧,动作弧必须在片段时长内完成;不得替换场景或重新设计人物 |
| **当前旁白script** | 运动来源 / 冲突依据 | 从文案核心动作提取运动方向;从文案核心冲突决定运动力道;从旁白情绪决定运动快慢 |
| **完整文案** | 仅氛围参考 | 仅用于理解整体氛围和情绪浓度;**禁止将其他段落的意象、物件引入当前片段** |
| **directorRef** | 运动风格 | 由上游分镜指定;不改变 shotDesc 的画面内容,只改变运动如何发生 |
```
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
整体氛围:鲜亮、温暖、有氛围感,像被金色夕阳或城市灯光包裹
```
**运动来源优先级**:旁白核心动词字面化 > shotDesc 动作起点 > 导演运动模板
### 硬性光影要求
## 三、运动幅度核心原则(固化,不可妥协)
```
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体要有"发光感",光要饱满、温暖、有重量感
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀只一点点warm glow / golden rim light / amber haze / 光线穿透感
```
**核心原则:动作必须有幅度,有冲击力,有画面张力。**
### 禁止出现的光影
- **大位移优于小动作**:优先设计身体重心位移(弯腰/站起/后仰/前冲)、物体横穿画面、空间关系重组
- **物件运动优先于身体微动**Kling 对手部/面部微动作执行极差,对物件(门/窗/旗帜/纸张/箱子)的空间位移执行稳定
- **环境响应必须可见**:主体的动作必须有环境反馈(物体被推动/地面有震动/光影随动作变化)
- **每个 shot 必须有一个明确的主要动作**:这个动作是视频的核心,其他都是辅运动
- 去饱和冷蓝影调("desaturated cool-blue grade"禁止)
- 大面积纯黑死黑(纯暗部禁止)
- 纯冷白光源 / 无温度的灰调光
- 灰暗、低饱和、平淡无光的画面
**禁止**
- 纯面部/手部微表情作为主要动作Kling 几乎不动)
- 纯呼吸/眨眼/手指轻点作为完整动作弧
- 动作幅度过小,无法支撑 5-6s 视频
---
**动作幅度硬性规则(违反则重写):**
- 运动主体必须有跨过画面的大位移,或者有物件被显著移动
- 肢体必须有大幅伸展或收缩
- 禁止只有手部/面部微动、呼吸、眨眼等微小动作
## 三、自然生活化原则
## 四、账号视觉运动基调
**核心**:有力量的酷,不是表演出来的酷,是自然散发出来的酷。
运动基调跟着文案走:
| 过于装逼(禁止) | 自然有力量(正确) |
|-----------------|-----------------|
| 人物永远处于力量展示姿态 | 人物在日常动作中有力量感(走/推/甩/靠) |
| 表情永远冷峻/愤怒 | 表情克制但有内容,自然流露 |
| 动作像在表演"我很酷" | 动作干净利落,酷是结果不是目的 |
| 刻意的高冷pose | 自然的都市年轻人状态 |
| 文案情绪 | 运动方向 |
**正确示例**:人物正常走路,但步伐有力;人物正常甩门,但干净利落有力量感。
**禁止示例**:人物站在城市最高点俯视镜头,表情永远愤怒/冷酷。
---
## 四、导演镜头运动词库(只对应镜头运动语言,色彩用 §二 硬性规则)
### Fincher 镜头运动层
| 运动类型 | 中文描述 |
|---------|---------|
| 爆发/对抗/紧张 | 动作快、力道强、有碰撞/推挤/撕裂感 |
| 沉重/揭示/压抑 | 动作慢、力道深、有下沉/积累/坠落感 |
| 克制/隐忍/对峙 | 动作极小但有压迫感,环境变化是主要运动 |
| 释放/跨越/爆发 | 动作大、有舒展/突破/穿越感 |
| 缓慢推进 | 镜头缓慢推向主体,积累压迫感和张力 |
| 快速横切 | 镜头快速横向切割画面,制造切换感/冲突感 |
| 定焦推进 | 镜头在固定位置缓慢推进,凝固张力 |
| 垂直下降 | 镜头从高处缓慢下降,揭示空间纵深 |
| 缓慢拉远 | 镜头缓慢拉远,揭示孤独感或全貌 |
禁止:阴暗下沉类运动(阴影吞噬/物体坠入深渊)除非文案明确要求
### Tarantino 镜头运动层
## 五、对可灵Kling的特殊约束
| 运动类型 | 中文描述 |
|---------|---------|
| 快速拉远 | 镜头快速拉远,揭示空间全貌或人物处境 |
| 跟拍横移 | 镜头跟随人物横向移动,保持同一速度,有速度感 |
| 快速甩镜 | 镜头快速甩向/甩离主体,有切换感/冲突感 |
| 俯冲视角 | 镜头从高处快速俯冲向人物,制造压迫感 |
| 快速摇镜 | 镜头快速摇向另一主体,有方向感 |
- **禁止**用"画面从X开场"作为 Prompt 开头 → 改用"镜头里,..."或"画面中,..."
- 主体运动必须包含**空间位移**或**形态明显变化**
- 结尾永远不给"定格在X" → 改为"某动作正在发生的中间状态"
- 优先使用**物件主导**的运动(物件被推动/移位/翻转),次选身体大幅位移,最次选肢体局部运动
### Kitano 镜头运动层
## 六、导演主体运动词库
| 运动类型 | 中文描述 |
|---------|---------|
| 缓慢横移 | 镜头缓慢横向移动,积累情绪和压抑感 |
| 静止凝视 | 镜头静止不动,沉默中积累张力 |
| 快速仰起 | 镜头快速从低处仰起,揭示孤独感或力量感 |
| 低角度跟拍 | 镜头从低角度跟随主体,赋予力量感/支配感 |
| 缓慢下降 | 镜头缓慢下降,沉入暗部,积累压抑感 |
本层负责:画面主体如何运动 + 运动节奏 + 时间感
构图内容来自 shotDesc光影来自图片提示词
镜头运动由 AI 模型自行决定
---
### 6.1 Tarantino 主体运动层
## 五、动作设计原则
运动核心:冷暖双光源对抗感 / 硬边阴影中的爆发 / 实用光源可见
### 5.1 从文案出发
| 主体运动 | 英文描述 | 中文描述 | 适用场景 |
|---------|---------|---------|---------|
| 爆发式推挤 | one figure slams a hand or fist onto a surface — the impact reverberates outward, objects displaced | 人物把手或拳头砸向某处——冲击向外扩散,物件被震位移 | 愤怒/对抗/压迫 |
| 穿越光影 | subject crosses from shadow into warm practical light or vice versa | 主体从阴影穿越到暖实用光,或从暖光退入阴影 | 转变/对抗/跨越 |
| 实用光爆闪 | a practical light source flares or brightens sharply — the room's atmosphere changes in an instant | 实用光源突然闪烁或变亮——空间氛围瞬间改变 | 紧张/顿悟/转折 |
| 物体横穿 | an object is thrown, pushed, or swept across the frame — crossing from one light zone to another | 物件被甩、推、扫过画面——从一个光区横穿到另一个 | 力量/冲突/转移 |
| 突然静止 | motion abruptly stops — the contrast between prior movement and sudden stillness is the action | 运动突然停止——运动与静止的对比本身就是动作 | 揭示/压迫/张力蓄积 |
**动作的来源是旁白的核心动词**,不是预设的动作词库。步骤:
### 6.2 Kitano 主体运动层
1. 读当前旁白 script找到核心动词"做"、"走"、"关"、"停"等)
2. 将动词字面化,如果动词本身动作感弱,放大动作幅度
3. 如果旁白没有明显动词,从冲突内核提取象征动作
运动核心:克制与沉默 / 大面积暗部中的微动作 / 都市夜环境
**动作幅度放大规则:**
- "走" → 大步横穿/冲刺
- "站" → 大步走向/大步跨入
- "停" → 猛然止步/快速刹车
- "看" → 猛然转头盯住/目光快速锁定
- "说" → 狠狠甩手机/狠狠砸向地面(象征沉默的力量)
- 无动词 → 从象征/暗喻/比喻找动作
| 主体运动 | 英文描述 | 中文描述 | 适用场景 |
|---------|---------|---------|---------|
| 暗部扩张 | shadow expands across the frame, consuming practical light at the edge | 阴影扩张吞噬画面,逐步覆盖边缘的实用光源 | 压迫/结局/沉默积累 |
| 物体坠落 | an object falls and lands with weight — one precise impact, then stillness | 物件坠落并重重落地——一声撞击,然后静止 | 结局/决定/沉重 |
| 缓慢位移 | a body or object moves a great distance with minimal visible effort — the stillness around it is deafening | 身体或物件以极小代价移动很长距离——周围的静止震耳欲聋 | 孤独/压制/潜台词 |
| 环境呼吸 | city lights or practical lights pulse slowly — the environment breathes, the subject does not | 城市灯光或实用光源缓慢明灭——环境在呼吸,主体不动 | 等待/积累/沉默 |
### 5.2 动作幅度底线
### 6.3 Fincher 主体运动层
每个 prompt 必须包含**至少一个大位移动作**或**一个强烈冲击动作**
运动核心:精确计算的渐进 / 冷蓝实用光中的不可阻止 / 揭示感
| 动作幅度 | 正确示例 | 错误示例 |
|---------|---------|---------|
| 大位移 | 物件被甩出画面横穿整个空间 | 物件轻微摇晃 |
| 身体大幅跨越 | 身体从画面左侧大步冲到右侧 | 身体微微前倾 |
| 强烈冲击 | 硬物砸向地面产生明显裂纹 | 手轻轻触碰物体 |
| 大幅甩/推/砸 | 手狠狠甩臂,物件横飞 | 手微微移动 |
| 主体运动 | 英文描述 | 中文描述 | 适用场景 |
|---------|---------|---------|---------|
| 精确位移 | a body part shifts at precise, measured intervals — mechanical and inevitable | 身体某部位以精确节奏移动——机械而不可阻止 | 规律揭示/不可逆/审视 |
| 物体重组 | objects on a surface are rearranged — one by one with cold precision | 表面物件被重新排列——一个接一个,冷峻精确 | 重构/计划/布局 |
| 冷光揭示 | cool practical light brightens incrementally — revealing detail at a calculated pace | 冷色实用光逐步变亮——以计算好的节奏揭示细节 | 审讯/拆解/揭示 |
| 阴影覆盖 | shadow from a practical source advances at constant speed — consuming the subject in precise increments | 来自实用光源的阴影以恒定速度推进——精确地一寸寸覆盖主体 | 不可逃脱/结局/压迫 |
**禁止的动作Kling 执行极差,画面几乎没有变化):**
- 手部/面部微动(捏/点/轻触/微微移动)
- 物件轻微摇晃/微微发光
- 纯呼吸/眨眼/身体轻微起伏
- "站"/"停"/"静"/"缓"/"微"/"轻"等弱动词
## 七、三层运动设计(核心,至少覆盖两层)
---
### 7.1 主体运动层(最高优先级
## 六、浪漫点缀(只一点点
运动素材来源
1. **先从当前旁白中提取核心动词**(掀/递/躺/切/站/走/推/拉/砸/摔)→ 字面化为主体可见的大幅度运动
2. **旁白有明确冲突双方** → 运动必须体现冲突的对抗力道
3. **旁白为概念型** → 找到象征物完成物理状态变化(象征物的变化本身即论点)
**动作幅度底线**:每个 videoPrompt 必须有一个跨画面大位移或物件被显著移动的动作。
### 7.2 环境运动层(账号通用)
词库:
只用在环境层少量点缀,配合暖调光影使用
```
practical light source flares or brightens sharply / shadow expands consuming frame edges /
object displaced by impact falls or slides / warm and cool light competing for dominance /
city lights pulse or street lamp pool widens / screen glow intensifies or dims /
neon sign flickering / dust particles visible in light beam after impact /
practical light source shifts angle reframing the scene
一抹暖光 / 一丝暖意 / 夜色微光 / 城市霓虹隐约闪烁 / golden rim light / amber haze
```
### 7.3 镜头运动层(辅助)
---
AI 视频模型自行决定镜头运动,提示词中不写具体镜头指令。
如必须暗示,只用:`slow zoom in / static shot / close-up on [body part]`
禁止push / pan / dolly / crane 等具体摄影术语。
## 八、模型语法规范
### 8.1 Kling可灵
## 七、Kling可灵格式规范
```
语法:中文为主
结构:自然语言叙述,主体运动 → 环境运动 → 结尾余势
固定结尾竖版9:16画幅无字幕无水印。
```
格式模板:
### 格式模板(完整维度版)
```
画面以参考图为起始帧。
[主体运动:从参考图状态出发,走到什么终点;
必须有跨画面大位移或物件被显著移动,
只描述运动,不重复描述画面内容]。
[环境运动:实用光源/阴影/物件发生什么变化]。
[片段结尾的余势:动作进行到什么中间状态]。
【0帧动原则第0帧立即发生视频从第一帧开始运动
无任何静置展示阶段,动作和镜头同时开始】
【主体动作第0-2秒内立即发生从文案核心动词提取动作
动作幅度要大,要有力,配合镜头运动同步启动】
例:狠狠甩臂/大步冲入/猛然推门/撕开/撞破/推倒
【环境响应中间2-3秒光源快速变化/阴影大面积覆盖/物件次要位移,
配合主体动作产生联动,暖调光影(金色/暖橙金)充满空间,
浪漫点缀(只一点点)】
【结尾最后1-2秒动作可以是下一个动作的开始
或镜头快速切走,不缓慢收尾,不慢慢结束】
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体要有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```
### 8.2 VEO
**禁止的 Prompt 结尾:** "缓缓" / "慢慢" / "渐渐" / "慢慢消失"(禁止慢速结尾)
**禁止使用弱动词:** "站" / "停" / "静" / "缓" / "微" / "轻" / "抬" / "落"
语法:英文 / 自然语言
格式模板:
---
## 八、自检清单(输出 videoPrompt 前逐条核对)
```
Opening with the reference image as the starting frame.
[主体运动from the reference image state to a clear endpoint;
must include a large spatial displacement or significant object movement,
describe only motion, do not re-describe the scene].
[环境运动what is changing in the practical light source, shadow, or objects].
[片段结尾的余势the action paused at what intermediate state].
aspect ratio 9:16, no text overlay, no subtitles, 24fps, cinematic.
[ ] 视频从第0帧立即开始运动无任何静置展示阶段
[ ] 主体动作从第0帧立即发生不是从第1-2秒才发生
[ ] 动作来源:从文案核心动词提取,不是预设动作词库
[ ] 主体动作幅度够大:大大步/冲/撕/撞/推/甩(不是微动)
[ ] 无弱动词:站/停/静/缓/微/轻/抬/落(全部替换)
[ ] 无"缓缓"/"慢慢"/"渐渐"等慢速结尾
[ ] 冲突动作来自 script 的核心动词或象征制造
[ ] 人物动作自然有力量,不要装逼/生硬/刻意表演感
[ ] 人物:女性=赫本+甜酷风+女人味 / 男性=少年感+潮流时尚
[ ] 有浪漫点缀(只一点点)
[ ] 使用 §二 硬性色彩规则:暖调为主(暖橙金/金色/琥珀色),有温度感,拒绝灰暗
[ ] 使用 directorRef 指定导演的镜头运动词库,无混合
[ ] 图文结合:视频动作是否延续图片的视觉象征(碎镜→镜碎/棋盘→棋子落定)?
[ ] 字数 ≥ 150字仅设下限建议精简但不强设上限
```
### 8.3 Grok
语法:英文 / 自然语言叙述
格式模板:
```
[自然语言完整描述:以参考图为起始帧,
主体从画面当前状态走向终点——
必须有跨画面大位移或物件被显著移动,
只描述运动,不重复描述画面内容]。
Vertical format 9:16, cinematic, no text.
```
---
## 九、输入规范
@@ -184,76 +202,199 @@ Vertical format 9:16, cinematic, no text.
【shotDesc】当前 Shot 的英文分镜描述
【当前旁白】该 Shot 对应的中文口播旁白
【完整文案】完整口播文案原文
【directorRef】tarantino / kitano / fincher
【directorRef】fincher / tarantino / kitano(分镜指定)
【目标模型】Kling / VEO / Grok
```
缺少任意一项,提示用户补充,不得凭空生成
缺少任意一项 → 返回错误并终止
---
## 十、输出格式
```
### Shot [N] 视频提示词 | [Xs] | [导演] | [模型]
**叙事意图:** 一句话说明这个片段在整体叙事中的功能
**核心冲突:** [文案的核心冲突是什么,这个 shot 视觉化了哪一方]
**主体运动(含幅度描述):** [具体描述,必须含大位移或物件移动]
**环境运动:** [具体描述]
**动势继承:** [shotDesc动作起点] → [视频中的完整动作弧]
**图文对应:** 旁白"XXX" → 图片视觉象征"XXX" → 本视频动作围绕此象征展开(碎镜→镜碎/棋盘→棋子落定)
**叙事意图:** 这帧在整体叙事中的功能
**动作来源(从文案提取):** script 的核心概念/动词 → 提取为何种大幅动作(主体形态不限)
**0帧动作第0帧立即发生** [镜头+主体动作从第一帧同时开始]
**主体动作第0-2秒** 动作从旁白核心动词/概念提取,幅度放大到肉眼可见的大幅度变化:
- 旁白是具体行为词 → 动作字面化 + 幅度放大(狠狠/大步/横冲/撞碎)
- 旁白是抽象概念 → 视觉象征物件做出对应动作(金色粒子爆发 / 沙漏流尽 / 棋子落定)
- 旁白是情绪/感受 → 物件/能量随情绪震动(冲击波膨胀 / 光环扩散)
- 主体形态不限:人物 / 动物 / 物体 / 能量场 / 场景变化均可
- 幅度要大:位移要横穿空间,物件要被撞/甩/砸/撕碎,能量要有爆发/扩散
**环境响应 + 浪漫点缀:** [暖调光源/阴影变化 + 一点点浪漫]
**自然生活化检查:** [动作是否有装逼感?是→重写]
**色彩与光影:** [暖调主光+温度感,拒绝灰暗]
**videoPrompt**
[完整提示词,可直接复制使用]
**剪辑衔接:**
- 片段开头:[第一帧状态,与静态分镜图对齐]
- 片段结尾:[最后一帧余势]
[完整提示词,要求 ≥ 150字仅设下限建议精简但不强设上限覆盖所有维度]
```
## 十一、质量自检清单(固化)
---
- 起始状态与静态分镜图完全匹配
- 覆盖三层运动中的至少两层
- **主体运动是否包含跨画面大位移或物件被显著移动?**→ 没有则重写
- **主体运动是否有幅度,有冲击力?**→ 纯手部/面部微动则重写
- 主体运动是否来自 directorRef 对应词库
- 不包含具体镜头运动指令
- 从当前旁白中提取了核心动词并字面化为运动
- 未引入其他 Shot 的具体意象(禁止剧透)
- 片段结尾留有余势(不是定格)
- 语言和参数格式与目标模型匹配
## 十一、图文结合策略
视频的图文结合与图片提示词 §九 策略一致,**视频是图片的动态化**。视频 prompt 中的动作必须延续图片的图文对应关系。
**视频中图文结合的核心**
- 图片 prompt 里选了哪个视觉象征(碎镜/棋子/沙漏/宣言手势…),视频里的动作就要围绕这个象征展开
- 旁白说"内耗" → 图片里是碎镜 → 视频里的动作:碎镜被狠狠打破 / 碎片横飞 / 冲击波光环扩散
- 旁白说"游戏" → 图片里是棋盘对弈 → 视频里的动作:棋子狠狠砸向棋盘 / 国王落定
- 旁白说"时间" → 图片里是沙漏 → 视频里的动作:金色流沙猛然倾泻 / 粒子随震动四溅
- 主体形态不限:人物 / 动物 / 物体 / 能量场 / 场景变化均可
**三个维度在视频里的表现方式**
- **潮玩形象动作**Bearbrick型人物做出对应动作——甩臂/宣告手势/棋子落定
- **时尚场景动作**streetwear 衣摆随动作飘动 / 霓虹灯光随运动闪烁
- **漫威VFX**:粒子爆发/冲击波/能量光环随动作触发
**检查清单**
```
[ ] 视频动作是否延续图片的视觉象征(碎片/棋子/沙漏/光环等做出大幅动作变化)?
[ ] 动作来源是否从旁白核心概念/动词提取(不只是人物动作)?
[ ] 动作触发时漫威VFX是否有配合冲击/散射/光环)?
```
---
## 十二、完整示例
### 示例A爆发对抗型
### 示例AFincher · 镜子冲突 + 缓慢推进
**文案:** 要么直接掀桌子发怒
**文案:** 从不在人际关系里内耗的人都有一个共性,论技不论心
**shotDesc** A man seated at a low wooden table, fists clenched on the surface, body beginning to lunge forward — table surface shaking from the tension already building
**shotDesc** Two clean-cut young figures face each other in warm golden street light. A mirror surface splits their reflection, creating a warm vs cool boundary. Urban minimalist backdrop, amber glow, clean layered streetwear, effortless cool, romantic city night ambiance.
**videoPromptKling**
画面中,人物双手攥拳压在桌面上,肩胛已经开始向前推进,桌面因积累的张力而微微颤动;下一秒,整个人以爆发式力量将桌面砸向前方——冲击向外扩散,桌上的物件被震离原位,暖色台灯光源随之剧烈闪烁。阴影与暖光在冲击的瞬间形成尖锐对抗。
**videoPrompt**
```
【0帧动原则视频从第一帧开始镜头立即缓慢推向两人】
主体动作第0-2秒立即发生两人在暖橙金光线中猛然同时甩臂
streetwear 随大动作有力飘动,少年感轮廓始终清晰,
干净利落有力量,不装逼,镜头同步缓慢推进。
环境响应中间2-3秒暖橙色街灯光在两人身上快速形成高光块
阴影随之缓慢大面积推进,光与阴影在两人之间形成精确边界,
golden rim light 在边缘快速闪烁,浪漫点缀(一点点)。
结尾:镜头继续缓慢推进至两人对视瞬间,积累张力,不缓慢收尾。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```
---
### 示例B沉重揭示型
### 示例BTarantino · 冷暖对抗 + 快速拉远
**文案:** 那是自己躺平在案板上
**文案:** 你把这扇门关上,这辈子就没机会了
**shotDesc** A figure lies horizontally across a smooth wooden surface, palms open facing upward — shadow from above slowly consuming the lit frame
**shotDesc** A man and a woman stand on either side of a heavy industrial door. Warm amber street light bleeds through the gap from outside. Inside is shadow and cool urban night. Both figures reach for the door handle. Clean-cut fashion, Tarantino edge contrast, romantic city night, Audrey Hepburn modern, sweet yet cool.
**videoPromptKling**
画面中,人物躯体横向展开平躺在光滑的木质台面上,双掌张开向上;顶上的冷色实用光源开始逐步变暗,阴影从画面上方缓慢向下吞噬暖光覆盖的范围,台面边缘的物件被阴影掠过并逐渐隐没。阴影以恒定速度一寸寸压过来,暖光区域持续收缩。
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即同时冲向那扇门】
主体动作第0-2秒立即发生两人狠狠同时推门
暖橙色街灯光随门的推开猛然爆射而入,
身体大步跨过门槛clean-cut 外套随跨越动作有力飘动,
强烈完成从黑暗到光明的穿越,自然有力,不刻意表演。
环境响应中间2-3秒暖色实用光随跨越快速充满空间
两人身上的暖橙金 rim light 快速勾勒出轮廓,
城市霓虹在背景中隐约闪烁,浪漫点缀(一点点)。
结尾:镜头快速跟随两人冲入光亮处,动作不缓慢收尾。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```
---
### 示例C克制动峙型
### 示例CKitano · 都市孤独 + 缓慢横移
**文案:** 真正的高手,面对算计,从来不翻脸
**文案:** 所有人都在走,只有你停下来
**shotDesc** A powerful figure seated upright at a desk, eyes fixed on a point off-frame, one hand resting flat — the entire room bathed in cool shadow except for one precise strip of practical light
**shotDesc** A man and a woman stand together at a rain-slicked urban crosswalk at night. Warm amber street lights wrap around them. While everyone else is blurred into motion, only they are in sharp focus. Kitano urban night, vast negative space, Audrey Hepburn modern, sweet yet cool, clean-cut youthful energy, romantic city night ambiance.
**videoPromptKling**
画面中,坐于桌前的人物纹丝不动,目光锁定画面之外的某处,一只手平放在桌面上;整个空间被冷色阴影笼罩,唯一一道精确的实用光源从侧面切入,将人物侧脸的一侧照亮,其余全部沉入冷暗。人物没有任何动作,但冷光在脸上的精确位置本身就是最大的压迫感。
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即停止镜头同步开始缓慢横移】
主体动作第0-2秒立即发生两人在斑马线上猛然止步
周围所有行人都是模糊的运动拖影,唯有人物静止站立,
streetwear 轮廓始终清晰,克制但有力量感,
镜头同步缓慢横移,与周围模糊运动形成对比。
环境响应中间2-3秒暖橙色街灯光在雨中快速折射出大面积光点
城市灯光随雨的节奏快速脉冲,
golden glow 笼罩两人,浪漫点缀(一点点)。
结尾:镜头继续缓慢横移,揭示两人与周围流动世界的反差。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```
---
### 示例DFincher · 物件冲突 + 快速横切
**文案:** 沉默才是最大的武器
**shotDesc** A man and a woman stand in a dark room. Between them, a delicate glass is suspended over a concrete floor by the woman's hand. Warm amber practical light on skin, cool shadow below. Effortless cool, Audrey Hepburn modern, sweet yet cool.
**videoPrompt**
```
【0帧动原则视频从第一帧开始女人立即甩臂镜头同步快速横切】
主体动作第0-2秒立即发生女人狠狠将玻璃杯甩向地面
玻璃碎片向四周猛烈爆射,横穿整个画面,
clean-cut 衬衫随手臂动作有力甩出,
男子在旁猛然侧身避开,少年感 streetwear 随动作清晰呈现,
自然有力,不装逼不刻意。
环境响应中间2-3秒暖橙色实用光在碎片上形成棱镜散射
阴影随冲击快速大面积扩散,
golden rim light 在碎片边缘闪烁,浪漫点缀(一点点)。
结尾:镜头快速横切至两人对视位置,揭示张力。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```
---
### 示例ETarantino · 象征暗喻 + 俯冲视角
**文案:** 越想赚钱,越被钱困住
**shotDesc** A man and a woman stand in a dark vault. Warm amber banknote light wraps around their bodies like a cage. The woman reaches for a gold coin while the man pulls away. Tarantino warm practical light, urban night atmosphere, Audrey Hepburn modern, sweet yet cool, youthful sharp silhouette.
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即向相反方向扯动镜头同步俯冲】
主体动作第0-2秒立即发生两人狠狠向相反方向扯动
金色纸币随拉扯动作猛然撕裂,
女人被纸币缠住猛然挣扎,男人狠狠拉回,
clean-cut 服装随撕扯产生大幅褶皱变化,少年感轮廓始终清晰,
有力但自然,不夸张表演。
环境响应中间2-3秒暖橙色实用光随撕裂快速形成大面积金色光区
纸币的裂口处金色光线猛然爆射而出,
城市远光在背景中隐约渗透,浪漫点缀(一点点)。
结尾:镜头快速俯冲向金色裂口,揭示纸币困住两人的瞬间。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体有发光感,光要饱满、温暖。
竖版9:16画幅无字幕无水印。
```

5
git.command Normal file
View File

@@ -0,0 +1,5 @@
#!/bin/bash
cd "$(dirname "$0")"
git add .
git commit -m "Update git command"
git push origin master