feat: MiniMax TTS集成、口播批量剪辑流水线、执黑先行二号账号

- 新增 minimax-tts.js 和 minimax-voice-clone.js 脚本
- 新增口播批量剪辑流水线 (口播_assemble.js, 口播_pipeline.js)
- 更新 video-from-script 各阶段脚本 (kling, images, tts, videos)
- 新增执黑先行二号-风格延伸账号
- 更新执黑先行 account.json 配置
- 替换 ugc_product_seeding 参考图
- 更新 CLAUDE.md 和依赖配置

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
This commit is contained in:
lc
2026-05-24 20:05:56 +08:00
parent 817c181cb5
commit 1e110219ff
31 changed files with 5098 additions and 34 deletions

View File

Before

Width:  |  Height:  |  Size: 263 KiB

After

Width:  |  Height:  |  Size: 263 KiB

View File

Before

Width:  |  Height:  |  Size: 2.9 MiB

After

Width:  |  Height:  |  Size: 2.9 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 96 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 2.7 MiB

View File

@@ -0,0 +1,35 @@
{
"id": "口播批量剪辑",
"name": "口播批量剪辑",
"description": "口播视频素材批量剪辑账号。用户提供视频文件ASR提取字幕修改错别字+删减冗余生成含字幕的剪映草稿。无AI生图/生视频,原视频画面直接使用。",
"pipeline": "transcript-edit",
"defaultFormat": "9:16",
"imageModel": "gpt-image",
"videoModel": null,
"ttsVoice": null,
"cover": {
"enabled": true,
"template": null,
"formats": ["9:16", "3:4"],
"channels": { "9:16": "抖音", "3:4": "小红书" },
"style": "待首次确认后锁定",
"textSource": "topicA",
"imageModel": "gpt-image"
},
"capcut": {
"subtitleStyle": {
"font": "思源黑体 Heavy",
"fontSize": 26,
"color": "#FFFFFF",
"highlightColor": "#F5A623",
"bold": true,
"hasShadow": true,
"shadowColor": "#000000",
"shadowAlpha": 0.6,
"transformY": -300,
"alignment": 1,
"inAnimation": "淡入",
"outAnimation": "淡出"
}
}
}

View File

@@ -15,6 +15,15 @@
"ttsVoice": "谢尔比",
"ttsRate": 1.3,
"ttsInstruction": "用一种过来人的口吻说话,像是经历了太多懒得废话的大哥,语气里带点漫不经心和不耐烦。声音不用太用力,轻描淡写但每个字都砸在点上。偶尔轻哼一口气,显得很松弛。",
"cover": {
"enabled": true,
"template": "references/cover_template.png",
"formats": ["9:16", "3:4"],
"channels": { "9:16": "抖音", "3:4": "小红书" },
"style": "动态场景人物+大字封面主体人物动作场景占画面60-70%,核心文字大字居中或上下分布,背景深暗,暖橙-冷蓝双光源对抗,漫威色调半写实。参考 cover_template.png 排版。",
"textSource": "topicA",
"imageModel": "gpt-image"
},
"storyboardPrompt": "prompts/分镜.md",
"imageStylePrompt": "prompts/图片提示词.md",
"videoStylePrompt": "prompts/视频提示词.md",

Binary file not shown.

After

Width:  |  Height:  |  Size: 2.6 MiB

View File

@@ -0,0 +1,84 @@
{
"id": "执黑先行二号-风格延伸",
"name": "执黑先行二号-风格延伸",
"description": "执黑先行风格延伸测试账号,用于探索新视觉风格,不影响主账号",
"pipeline": "image-video",
"defaultFormat": "9:16",
"imageModel": "gemini",
"videoModel": "kling",
"batchSize": 30,
"styles": {
"执黑先行二号-风格延伸": {
"references": []
}
},
"ttsVoice": "谢尔比",
"ttsRate": 1.3,
"ttsInstruction": "用一种过来人的口吻说话,像是经历了太多懒得废话的大哥,语气里带点漫不经心和不耐烦。声音不用太用力,轻描淡写但每个字都砸在点上。偶尔轻哼一口气,显得很松弛。",
"cover": {
"enabled": true,
"template": "references/cover_template.png",
"formats": ["9:16", "3:4"],
"channels": { "9:16": "抖音", "3:4": "小红书" },
"style": "动态场景人物+大字封面主体人物动作场景占画面60-70%,核心文字大字居中或上下分布,背景深暗,暖橙-冷蓝双光源对抗,漫威色调半写实。参考新视觉风格方向。",
"textSource": "topicA",
"imageModel": "gpt-image"
},
"storyboardPrompt": "prompts/分镜.md",
"imageStylePrompt": "prompts/图片提示词.md",
"videoStylePrompt": "prompts/视频提示词.md",
"capcut": {
"effects": [],
"filter": "自然日光:30",
"subtitleStyle": {
"font": "思源黑体 Heavy",
"fontSize": 12,
"color": "#FFFFFF",
"highlightColor": "#F5A623",
"bold": true,
"hasShadow": true,
"shadowColor": "#3D2B1F",
"shadowAlpha": 0.6,
"transformY": -380,
"alignment": 1,
"inAnimation": "淡入",
"outAnimation": "淡出"
},
"keywordStyle": {
"textEffect": "简约白色黑边花字",
"fontSize": 60,
"color": "#F5A623",
"bold": true,
"transformY": 0,
"inAnimation": "打字机效果",
"outAnimation": "模糊淡出",
"inAnimDuration": 300000,
"outAnimDuration": 300000
},
"defaultBGM": "",
"transitions": {
"strategy": "rhythm",
"default": { "name": "叠化", "duration": 200000 },
"byPosition": {
"hook": { "name": "叠化", "duration": 200000 },
"keypoint": { "name": "叠化", "duration": 250000 },
"body": { "name": "叠化", "duration": 300000 },
"closing": { "name": "叠化", "duration": 400000 }
},
"byDirector": {
"tarantino": { "name": "叠化", "duration": 250000 },
"kitano": { "name": "叠化", "duration": 300000 },
"fincher": { "name": "叠化", "duration": 200000 }
}
},
"kenBurns": {
"enabled": true,
"default": { "startScale": 1.0, "scaleRate": 0.9, "panXRate": 0, "panYRate": 0 },
"byDirector": {
"tarantino": { "startScale": 1.0, "scaleRate": 0.85, "panXRate": 0, "panYRate": 0 },
"kitano": { "startScale": 1.03, "scaleRate": 0.5, "panXRate": 0, "panYRate": 0 },
"fincher": { "startScale": 1.0, "scaleRate": 0.4, "panXRate": 0, "panYRate": 0 }
}
}
}
}

View File

@@ -0,0 +1,428 @@
# 分镜脚本生成 Agent v11执黑先行账号专用版
## 一、铁律(违反则整条打回重写,不可妥协)
1. **导演禁止混合**:全部 shot 必须使用同一导演,中途不得切换
2. **每个 shot 前0帧必须有视觉动作**:视频一播放就必须有动作发生,禁止任何静置展示
3. **每个 shot 必须有具体视觉物件**:禁止纯姿态/纯站/纯坐/纯走路描述
4. **好看是第一优先级**:任何身份/物品/场景都要时尚有型——**酷 + 时尚 + 潮流 + 少年感 + 浪漫点缀**
5. **性张力**:出现人物时,整体气质要有少年感+潮流感+女人味(女性)/ 少年感+酷(男性);不是单一穿搭元素,是整体气质的平衡
6. **人物多样性**:人物数量和组合由文案决定——文案提到几个人就几个人(可以是单人可以是多人),同一成片内 shot 之间可以男/女/男女混合,不必每个 shot 都一样;整体上避免全片只有单一性别独占。
---
## 二、色彩与光影硬性规则(每张图必须使用)
以下色彩和光影规则为执黑先行账号的统一要求,**所有 shot 无条件执行**,不得以任何理由降低标准。
### 硬性色彩要求
```
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
整体氛围:鲜亮、温暖、有氛围感,像被金色夕阳或城市灯光包裹
```
### 硬性光影要求
```
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀只一点点warm glow / golden rim light / amber haze / 光线穿透感
```
### 禁止出现的光影
- 去饱和冷蓝影调Fincher 原版"desaturated cool-blue grade"禁止)
- 大面积纯黑死黑Kitano 纯暗部禁止)
- 纯冷白光源 / 无温度的灰调光
- 灰暗、低饱和、平淡无光的画面
---
## 三、"好看"的完整定义(写死)
好看 = **酷 + 时尚 + 潮流 + 甜酷风 + 自然生活化 + 浪漫点缀**
**核心:自然有力量的酷,不是表演出来的酷。**
**男性(少年感):**
- 干净、清爽、不油腻、轮廓清晰、永远年轻
- clean-cut silhouette / effortless cool / 简单有力穿搭 / 像年轻时的 Steve McQueen / James Dean
- unpretentious cool / youthful energy / no frills / minimal but intentional
**女性(甜酷风 + 赫本形象):**
- 赫本长相为核心参照(面部留白 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度)
- 甜酷风:女人味的甜 + 酷感外壳,甜和酷同时成立,不是甜腻也不是假小子
- 清爽、精致、高级、时尚、潮流、干净利落
- 通用词Audrey Hepburn modern urban translation / sweet yet cool / feminine elegance meets street edge / graceful but edgy / elegant urban cool / clean feminine charm
**时尚潮流感:**
- 人物streetwear / 高端潮牌 / 设计师款 / 干净利落
- 物品:设计感 / 有质感 / 不普通
- 场景:城市感 / 霓虹 / 极简 / 杂志感
**浪漫点缀(只一点点):**
- a hint of warm glow / a single warm light source / subtle atmospheric haze
- romantic night city ambiance / barely-there warmth / one soft accent light
- 少量暖光 / 夜色氛围 / 微妙情绪
**自然生活化(重要):**
- 人物动作有生活质感,不是舞台表演;动作有力量但不做作
- 避免永远在摆pose / 永远俯视镜头 / 永远愤怒冷酷表情
**禁止**:土气 / 油腻 / 老气 / 普通职场照 / 邋遢 / 无轮廓 / 过度甜腻 / 女性去女性化 / 装逼感
---
## 四、性张力规则
**性张力来自整体气质,不是单一元素。**
核心:甜酷风(女性)+ 少年感(男性)+ 潮流感 同时成立。
- **女性**:赫本长相 + 甜酷风(女人味的甜 + 酷感外壳);清爽精致高级,甜和酷同时成立;穿搭可以是修身/宽松/设计师款,重点是干净利落有设计感
- **男性**不管年龄永远少年感clean-cut / effortless cool / 轮廓清晰 / 简单有力
- **穿搭是气质的外化**:可以有修身紧身,也可以宽松但有型,重点是干净利落
**正确示范:**
- 女性:赫本风现代都市版 + 甜酷设计师款 / 精致优雅 + 城市潮流感
- 男性:干净利落的基本款叠穿 / 简单 streetwear / 轮廓清晰少年感
**禁止**:油腻 / 土气 / 老气 / 无轮廓 / 过度暴露 / 过度甜腻 / 邋遢 / 女性去女性化
---
## 五、导演构图与镜头运动词库
导演词库**只对应构图方式和镜头运动语言**,色彩和光影统一使用 §二 硬性规则。
### Fincher精确几何·冷峻分析
**构图关键词:**
- 硬边阴影切割画面,主体精确落在光影交界线上
- 精确对称构图但有一处破坏
- 建筑感构图architectural composition
- 硬边阴影几何块hard geometric shadow blocks
- 去饱和色调,高级时装感构图
- clean-cut 少年感穿搭,高级简洁
- 现代都市感,都市冷酷感
**镜头运动关键词:**
- 缓慢推进slow push-in积累压迫感
- 快速横切fast whip pan制造切换感
- 定焦推进static push凝固张力
- 垂直下降vertical drop揭示空间纵深
### Tarantino力量爆发·暖冷对抗
**构图关键词:**
- 冷暖双色光源在主体身上形成边缘对抗
- 实用光源(台灯/霓虹/街灯)制造暖色轮廓光
- 硬边阴影分割画面,暖光勾亮轮廓
- 都市街头潮流感,少年感 streetwear动作有爆发力clean-cut
- 人物站在光影交界处冷暖双色对比effortless cool
- 动作驱动构图action-driven composition
**镜头运动关键词:**
- 快速拉远fast pull-back揭示全貌
- 跟拍横移tracking shot跟随运动主体
- 快速甩镜fast whip pan切换冲突
- 俯冲视角crash zoom down制造压迫感
### Kitano克制孤独·都市哲思
**构图关键词:**
- 负空间构图negative space composition
- 主体孤立在画面中心,大面积留黑但有光感
- 冷蓝实用光源从上方或侧方切入,暖色城市远光渗透
- 都市夜景,霓虹灯在暗部中发光,有温度的光
- 主体孤立在画面中心克制但有视觉张力clean-cut 少年感
- 都市年轻人的孤独感,高级感留白,浪漫夜色氛围(只一点点)
**镜头运动关键词:**
- 缓慢横移slow tracking积累情绪
- 静止凝视static hold沉默张力
- 快速仰起fast tilt-up揭示孤独感
- 低角度跟拍low-angle tracking赋予力量感
---
## 六、时间线铁律(违反则整条打回重写,不可妥协)
### ⚠️ 铁律一:音频是神圣的,不可修改
- TTS 语速 = **1.15x**(固定),不得加速/减速/裁剪/静音
- **口播文案不可改字**script 内容由用户定,分镜只决定切割位置
- **音频时长 = 视频时长**:画面必须配合音频,音频不配合画面
- Kling 每个视频片段固定 **6 秒**
### ⚠️ 铁律二:分镜规划前必须先完成文案预切割
**第一步(在写任何 shotDesc 之前)**:按以下规则把完整口播文案切分成 shot
1. 估算公式:每个 shot 的 TTS 时长 = **script 字数 ÷ 5**(秒)
- 语速基准1.15x 正常中文说话速率 ≈ 5字/秒
2. 每个 shot 估算时长必须 **≤ 6 秒**= 最多 **30字**
3. 相邻两段合并后 ≤ 30字 → **强制合并**为一个 shot
4. 任何 shot 估算 > 6s → **强制在语义断点处拆分**
| TTS 估算 | 决策 |
|---------|------|
| < 3秒<15字 | 强制合并至相邻 Shot合并后 ≤ 30字 |
| 36秒1530字 | 可独立 shot |
| > 6秒>30字 | **强制拆分,每新 shot ≤ 30字** |
### ⚠️ 铁律三:视频 vs 音频的唯一合法处理策略
| 情况 | ratio = 视频(6s) ÷ 音频 | 策略 |
|------|------------------------|------|
| 视频 > 音频ratio 1.12x | ✅ 视频加速speed_up|
| 视频 >> 音频ratio > 2x | ✅ 视频截断trim|
| 视频 ≈ 音频ratio 0.91.1x | ✅ 无需调整none|
| **音频 > 视频ratio < 0.9** | ❌ **禁止!** 必须打回分镜重新拆分 script |
**绝对禁止**:视频放慢 / 冻结帧 / 音频加减速 / 音频裁剪
### ⚠️ 铁律四:音频实测 > 6s 时的补救
如果 TTS 实测超过 6s估算误差导致
1. 在语义断点处把 **音频文件物理切割**ffmpeg -t / -ss
2. 把对应 script 同步切分为多个 shot
3. 每个新 shot 独立配一个 Kling 6s 视频
4. **禁止**:拉伸视频 / 截断音频内容 / 改变语速
---
## 七、shotDesc 质量规则(逐条检查,违反则重写)
**1. 冲突(最高优先级)**
- 每个 shot 必须有明确的冲突类型(期待 vs 现实 / 想要 vs 不能要 / 表面 vs 内心 / 我 vs 你 / 行动 vs 停滞 / 过去 vs 现在)
- 冲突的核心必须强关联当前 shot 的文案——看了画面能联想到旁白说了什么
- 当旁白没有表面冲突 → 从全文理解,提取抽象冲突内核,用象征/暗喻/比喻制造视觉冲突
- 冲突感强化词叠加使用scene already in progress when clip begins / conflict at peak not at start / no establishing shot
**2. 中途入场前0帧冲击**
- 视频一播放,动作就已在进行中,禁止从平静开始
- 前 0 帧必须有动作发生(镜头动或人/物动),禁止任何静置展示
- 动作要足够强烈:大幅位移、闯入、撞碎、甩离——不是微动
**3. 视觉物件**
- 包含至少一个具体可辨识的物件(道具/装置/环境元素)
- 物件是冲突的载体
**3. 动作弧**
- 包含完整动作(起点→终点),幅度肉眼可见
- 动作本身即冲突的视觉化
- 人物组合由文案决定单人多人都可以shot 间可以变化
**4. 概念对应**
- 画面直击当前 script 的核心论点
- 文案说"做大"→画面有跨越/扩张;文案说"闭嘴"→画面有封闭/沉默的压迫感
**5. 好看 + 甜酷风 + 浪漫点缀**
- 出现的女性:赫本长相 + 甜酷风(甜 + 酷同时成立)+ 女人味重要 + 潮流时尚
- 出现的男性:少年感(干净/清爽/不油腻/轮廓清晰)+ 潮流时尚
- 出现物品:设计感/质感,不普通
- 场景:城市感/霓虹/极简/杂志感
- 浪漫点缀只一点点warm glow / 夜色氛围 / 微妙情绪
- 核心:女性甜酷风+赫本+女人味 / 男性少年感 + 潮流感 同时成立
**6. 禁止项**
- 禁止纯站着/坐着/走路开场
- 禁止无物件的画面
- 禁止表情/手部微动作为完整动作弧
- 禁止土气/油腻/老气形象
- 禁止女性去女性化boylish / 假小子 / 无女人味)
---
## 八、抽象冲突制造方法
当旁白没有表面冲突时,从全文理解冲突内核,用象征手法呈现:
| 旁白类型 | 冲突内核 | 象征/暗喻画面 |
|---------|---------|--------------|
| 概念型/哲理型 | 内在矛盾 | 镜像/分裂/枷锁/镜像扭曲 |
| 积累型 | 压迫与爆发 | 空间收缩/物体崩裂/光线突破 |
| 对比型 | 两方对抗 | 光影分割/颜色对立/身体分界 |
| 沉默型 | 压抑的张力 | 悬停/临界状态/即将发生的瞬间 |
---
## 八、中途入场原则0帧冲击
### 核心原理「In Medias Res」
**每个片段不从"开始"拍,而是从"已经发生到最紧张的那一秒"开始。**
> 冲击力 = 动作已在进行 + 信息不完整引发好奇 + 画面或人物有明显运动
视频一播放,观众就必须看到动作正在发生。不要给观众"平静的起点"——让他们用前3秒追赶画面他们就没有时间划走。
### 中途入场的两种来源
#### A 类 —「镜头动」:摄影机运动制造冲击
| 运动方式 | 描述 |
|---------|------|
| 急速下降落地 | 镜头从高处快速下降至地面,揭示已发生的动作 |
| 旋转切入 | 镜头旋转进入场景dutch 角度修正 |
| 极速推进Smash Zoom | 从极宽到极近,一秒内完成,不渐变 |
| 跟不上的跟拍 | 镜头追赶主体,主体已在前方,部分出画 |
| 遮挡物后突然暴露 | 镜头或主体移动,场景信息突然释放 |
#### B 类 —「人/物动」:主体运动制造冲击
| 运动方式 | 描述 |
|---------|------|
| 突然转身/回头 | clip opens mid-turn头发甩入画面部在第一帧锁定镜头 |
| 闯入画面 | 人物从边缘高速入画,无预警,镜头捕捉其跨步瞬间 |
| 抓握/推开 | clip opens on 手已抓住手腕/衣领——张力已在峰值,无前置 |
| 物体砸向镜头 | 物件在开场帧直接扔向镜头,极致近景冲击,然后切反应 |
| 从画面外拉入 | 人物被拉入/拽入,已失去平衡,观众立刻问"谁在拉" |
### 冲突感强化词(叠加使用)
```
scene already in progress when clip begins
conflict at peak not at start
no establishing shot — drop viewer into middle of action
whip pan opening, subject in motion frame one
asymmetric power dynamic immediately visible
something has just happened or is about to — viewer must catch up
```
### 按情绪分类的开场模板
| 情绪类型 | 开场策略 |
|---------|---------|
| 愤怒/对抗 | clip opens on face inches from facealready shouting or silent with rage |
| 欲望/吸引 | clip opens mid-turnsubject's gaze snaps to something off-screen |
| 逃跑/追逐 | clip opens on feet already runningground blurring belowcamera low |
| 沉默的张力 | clip opens on two figures, backs to each other, already in standoff |
| 意外/反转 | clip opens on mundane detail — something is wrong that viewer can't immediately name |
---
## 九、冲突感设计:文案→画面的视觉转化
### 核心思路
文案口播的本质是**情绪在时间轴上的变化**。每一段文案背后都有一个隐藏的冲突结构。分镜的任务不是"配图",而是**把文案的潜台词可视化**。
### 六种冲突类型
| 冲突类型 | 文案信号词 | 画面方向 |
|---------|---------|---------|
| **期待 vs 现实** | 以为/结果/没想到 | 人物表情从期待到落空 |
| **想要 vs 不能要** | 明明/但是/偏偏 | 人物靠近又克制后退 |
| **过去 vs 现在** | 曾经/现在/回头看 | 同一空间两种状态并置 |
| **表面 vs 内心** | 笑着/装作/其实 | 面部微表情与动作不一致 |
| **我 vs 你** | 你从来/我一直/凭什么 | 两人物理距离与心理距离的反差 |
| **行动 vs 停滞** | 我决定/却还是/没走 | 人物中途停下或转身未完成 |
### 快速判断冲突的三个问题
每次拿到一段文案,只问:
1. **「谁想要什么,得不到?」** → 欲望冲突
2. **「谁知道什么,说不出?」** → 信息冲突
3. **「谁在走,谁在留?」** → 行动冲突
三个问题至少能回答一个,画面就有了。
### 图文结合三关系(选对才有效)
| 关系 | 说明 | 效果 |
|------|------|------|
| **平行** | 画面直接呈现文案内容 | 清晰但无惊喜 |
| **对位** | 画面呈现文案的反面或潜台词 | 有层次感,耐看 |
| **延伸** | 画面在文案结束后继续发展 | 余韵感强,留白最强 |
**最优组合 = 对位 + 延伸**
> 文案说"我放下了" → 画面是人物手指慢慢松开某样东西,但镜头停在那个东西上,没有跟着人走
---
## 十、自检清单(输出前必须逐条核对)
```
[ ] 每个 shot 有明确的冲突类型期待vs现实/想要vs不能/表面vs内心/我vs你/行动vs停滞/过去vs现在
[ ] 中途入场:动作已在进行中,观众必须追赶画面
[ ] 所有 shot 使用同一导演,无混合
[ ] 色彩和光影使用 §二 硬性规则,无去饱和冷蓝/纯黑/灰调光
[ ] 每个 shot 有具体视觉物件(不是纯姿态)
[ ] 每个 shot 前0帧动作幅度够大大幅位移/闯入/撞碎/甩离(不是微动)
[ ] TTS 估算全部 ≤ 6s
[ ] 所有 script 拼接 = 原文一字不差
[ ] 出现的人物:女性=赫本长相+甜酷风+女人味 / 男性=少年感+潮流时尚,整体气质平衡,无土气/油腻
[ ] 场景或物件有潮流元素,有浪漫点缀(只一点点)
[ ] 当旁白无表面冲突时,已用象征/暗喻手法制造冲突画面
[ ] 人物数量和组合由文案决定,单人/多人/混合均可shot 间可以变化
[ ] 色彩:暖调为主(暖橙金/金色/琥珀色),有温度感的光,拒绝灰暗无光
```
---
## 十一、导演选择方法
根据文案整体气质选定一位导演,全部 shot 统一使用:
| 文案气质 | 推荐导演 | 镜头语言 |
|---------|---------|---------|
| 冷静分析、揭示真相、有深度 | Fincher | 极慢推镜 / 上帝俯瞰 / 静止锁定机位 |
| 力量主张、跨越对抗、爆发感 | Tarantino | 后备箱仰角 / 长镜对话 / 脚部特写切入 |
| 孤独积累、克制沉默、都市哲思 | Kitano | 静止长镜 / 侧面轮廓 / 空镜插入 |
**导演镜头运动示例(分镜规划时可直接使用):**
**Fincher — 「冷静的上帝视角」**
- imperceptibly slow push-in toward subject, almost imperceptible camera drift forward
- straight down top-down crane shot, figures reduced to geometric shapes
- locked-off symmetrical wide shot, zero camera movement, subject moves through perfectly composed frame
- smooth tracking shot following subject from behind at fixed distance, steadicam glide
**Tarantino — 「人物即舞台,对话即表演」**
- extreme low angle looking up at characters from below ground level, figures tower against sky
- slow alternating over-the-shoulder shots during dialogue, gradual push-in per cut
- low camera tracking laterally alongside walking characters, slow motion or normal speed
- unexpected close-up cutaway to feet, shoes, hands, low angle floor-level framing
**Kitano — 「沉默比台词更重」**
- completely static locked-off shot held for extended duration, characters enter and exit without camera following
- scene cuts abruptly before or after expected climax, violence happens off-screen
- characters staged in strict profile, facing opposite directions, emotional distance through staging
- sudden cut to empty landscape — ocean, sky, empty road — held stillness as punctuation
---
## 十二、输出格式
**第一步:输出总览行**
```
文案共识别 X 个语义场景 | 预计总时长 XX 秒 | 共 X 个 Shot
导演XXX禁止混合
[TTS规划] S1: Xs / S2: Xs / ...
[色彩与光影] 暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗
[人物安排] 人物数量和组合由文案决定(如:单人/双人多视角/男女混合shot间可变化
```
**第二步:逐条自检清单核对**
**第三步:输出 JSON**
```json
[
{
"id": 1,
"shotDesc": "英文画面描述(必须含:冲突动作 + 视觉物件 + 时尚潮流感 + 性张力穿搭 + 浪漫点缀)",
"script": "原文逐字摘取,禁止改写",
"duration": "TTS估算秒数=字数÷5保留1位小数",
"directorRef": "fincher | tarantino | kitano全部统一"
}
]
```

View File

@@ -0,0 +1,268 @@
# 图片提示词生成器 v1执黑先行二号-风格延伸(测试账号)
> **版本说明**:本账号用于新视觉风格测试。§二(色彩与光影)和 §九(图像风格参考)待参考图分析后注入,其余结构框架与主账号一致。
---
## 一、铁律(违反则回写失败,必须重写)
1. **导演只对应构图**imagePrompt 光影层必须使用分镜指定的同一导演词库,全程不切换。色彩和光影氛围统一使用 §二 硬性规则
2. **好看 = 酷 + 时尚 + 潮流 + 浪漫点缀**:任何身份/物品/场景都要时尚有型
3. **性张力(穿搭剪裁)**:出现人物时,穿搭必须修身/紧身/露肤适度,体现身材轮廓但不暴露
4. **当旁白无表面冲突时**:从全文理解冲突内核,用象征/暗喻/比喻制造视觉冲突画面
5. **shotDesc 决定画什么directorRef 决定构图执行方式**:禁止擅自改变画面内容
6. **人物由文案决定**单人多人都可以shot间可变化整体避免单一性别独占
---
## 二、色彩与光影硬性规则(待参考图注入)
> ⚠️ **本节待定**:参考图分析完成后,由以下模板填入具体色彩与光影规则。
> 在参考图确认前,暂时沿用执黑先行主账号的色彩规则作为测试基底。
### 当前测试基底(参考图确认后替换)
```
色彩基调:【待参考图定义】
主色调:【待参考图定义】
辅助色:【待参考图定义】
整体氛围:【待参考图定义】
```
### 光影规则(待参考图定义)
```
光源质感:【待参考图定义】
光感:【待参考图定义】
阴影处理:【待参考图定义】
氛围层:【待参考图定义】
```
### 禁止出现的光影(待参考图定义)
- 【待参考图定义——与新风格冲突的色系将在此列出】
---
## 三、"好看"的完整定义(写死)
好看 = **酷 + 时尚 + 潮流 + 甜酷风 + 浪漫点缀**
**男性(少年感):**
- 干净、清爽、不油腻、轮廓清晰、永远年轻
- clean-cut silhouette / effortless cool / 像年轻时的 Steve McQueen / James Dean
- unpretentious cool / youthful energy / no frills / minimal but intentional
**女性(甜酷风 + 赫本形象):**
- 赫本长相为核心参照(面部留白 / 眉峰平缓干净 / 气质克制 / 眼神平静有内容 / 妆容有辨识度)
- 甜酷风:女人味的甜 + 酷感外壳,甜和酷同时成立
- 清爽、精致、高级、时尚、潮流、干净利落
- 通用词Audrey Hepburn modern urban / sweet yet cool / feminine elegance meets street edge / graceful but edgy / elegant urban cool / clean feminine charm
**时尚潮流感:**
- 人物streetwear / 高端潮牌 / 设计师款 / 干净利落
- 物品:设计感 / 质感 / 不普通
- 场景:城市感 / 霓虹 / 极简 / 杂志感
**浪漫点缀(只一点点):**
- a hint of warm glow / a single warm light source / subtle atmospheric haze
- romantic city night ambiance / barely-there warmth / one soft accent light
**禁止**:土气 / 油腻 / 老气 / 普通职场照 / 邋遢 / 无轮廓 / 过度甜腻 / 女性去女性化
---
## 四、性张力规则
**性张力来自整体气质,不是单一元素。**
核心:甜酷风(女性)+ 少年感(男性)+ 潮流感 同时成立。
- **女性**:赫本长相 + 甜酷风(女人味的甜 + 酷感外壳);清爽精致高级,甜和酷同时成立;穿搭可以是修身/宽松/设计师款,重点是干净利落有设计感
- **男性**不管年龄永远少年感clean-cut / effortless cool / 轮廓清晰 / 简单有力
- **穿搭是气质的外化**:可以有修身紧身,也可以宽松但有型,重点是干净利落
**禁止**:油腻 / 土气 / 老气 / 无轮廓 / 过度暴露 / 过度甜腻 / 邋遢 / 女性去女性化
---
## 五、导演构图词库(只对应构图,色彩用 §二 硬性规则)
### Fincher 构图层
```
硬边阴影切割画面,主体精确落在光影交界线上,
精确对称构图但有一处破坏,建筑感构图,
硬边阴影几何块hard geometric shadow blocks
高级时装感构图clean-cut 少年感穿搭,高级简洁,现代都市冷酷感
画风补充:【待参考图定义画风词】
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
### Tarantino 构图层
```
冷暖双色光源在主体身上形成边缘对抗,
实用光源(台灯/霓虹/街灯)制造轮廓光,
硬边阴影分割画面,暖光勾亮轮廓,
都市街头潮流感,少年感 streetwear动作有爆发力clean-cut
人物站在光影交界处effortless cool
动作驱动构图action-driven composition
画风补充:【待参考图定义画风词】
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
### Kitano 构图层
```
负空间构图negative space composition
主体孤立在画面中心,大面积留白但有光感,
实用光源从上方或侧方切入,暖色城市远光渗透,
都市夜景,霓虹灯在暗部中发光,有温度的光,
克制但有视觉张力clean-cut 少年感,
都市年轻人的孤独感,高级感留白,浪漫夜色氛围(只一点点)
画风补充:【待参考图定义画风词】
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
---
## 六、imagePrompt 维度结构(必须覆盖全部维度)
imagePrompt 必须按以下顺序写全以下维度,不得遗漏:
```
[1. 主体描述]
人物:是谁/在做什么/具体的动作和姿态(来自 shotDesc完整保留
[2. 外貌与气质]
- 脸:赫本长相(女)/ 轮廓清晰(男)
- 表情:克制/平静/有内容(不是空洞,不是夸张)
- 气质:甜酷(女)/ 少年感(男)/ effortless cool
[3. 穿搭细节]
具体描述穿什么/什么材质/什么剪裁/什么颜色/有什么配饰
(至少写清楚上身+下身+一个配饰或细节)
[4. 环境细节]
具体描述场景里有什么/光从哪来/背景是什么
(至少写清楚背景材质+光源+一个空间细节)
[5. 情绪与氛围]
这个画面传递什么情绪/什么氛围/旁白的什么情绪被视觉化了
[6. 色彩与光影硬性层(必须使用 §二 硬性规则)]
参考图定义的色彩规则(待填入)
[7. 导演构图层]
来自 directorRef 指定导演的完整构图词组(不替换,不混合)
[8. 画风词尾(待参考图定义,固定不变)]
【参考图分析后替换此处为新风格的固定词尾】
cinematic composition, full bleed, no border, no frame, no margin,
no text, no watermark, no logo. Vertical format, aspect ratio 9:16.
```
---
## 七、自检清单(输出 imagePrompt 前逐条核对)
```
[ ] shotDesc 画面内容 100% 保留,无删减替换
[ ] 人物组合由文案决定,单人/多人/混合均可
[ ] 人物外貌:女性=赫本+甜酷 / 男性=少年感+轮廓清晰,有具体描述
[ ] 穿搭细节:上身+下身+至少一个配饰或细节(具体描述)
[ ] 环境细节:背景材质+光源+至少一个空间细节(具体描述)
[ ] 情绪与氛围:有写,不是空白
[ ] 无土气/油腻/老气形象
[ ] 色彩使用 §二 硬性规则(参考图确认后检查项更新)
[ ] 构图使用 directorRef 指定导演的完整构图词组,无混合
[ ] 图文结合shotDesc 里的视觉物件是否直接对应旁白的核心概念
[ ] shotDesc 中的动作是"即将发生"的瞬间,非"已完成"状态
[ ] 字数 ≥ 200字
```
---
## 八、冲突感设计:文案→画面的视觉转化
### 核心思路
文案口播的本质是**情绪在时间轴上的变化**。每一段文案背后都有一个隐藏的冲突结构。图片的任务不是"配图",而是**把文案的潜台词可视化**。
### 六种冲突类型
| 冲突类型 | 文案信号词 | 画面方向 |
|---------|---------|---------|
| **期待 vs 现实** | 以为/结果/没想到 | 人物表情从期待到落空 |
| **想要 vs 不能要** | 明明/但是/偏偏 | 人物靠近又克制后退 |
| **过去 vs 现在** | 曾经/现在/回头看 | 同一空间两种状态并置 |
| **表面 vs 内心** | 笑着/装作/其实 | 面部微表情与动作不一致 |
| **我 vs 你** | 你从来/我一直/凭什么 | 两人物理距离与心理距离的反差 |
| **行动 vs 停滞** | 我决定/却还是/没走 | 人物中途停下或转身未完成 |
---
## 九、图像风格参考(待参考图注入)
> ⚠️ **本节待定**:参考图上传并分析后,在此填入新风格的完整描述。
### 风格识别(待定)
```
核心风格:【待参考图分析】
媒介感:【待参考图分析】
色彩系统:【待参考图分析】
光影系统:【待参考图分析】
构图特征:【待参考图分析】
```
### 通用图像提示词模板(待定)
```
【参考图分析完成后,在此生成三个模型版本的风格词:
- Gemini 版:英文自然语言句子
- MJ 版:英文逗号短语 + --ar 9:16 --style raw
- Kling 版:中文描述】
```
---
## 十、输入规范
```
【shotDesc】当前 Shot 的英文分镜描述
【当前旁白】该 Shot 对应的中文口播旁白
【完整文案】完整口播文案原文
【directorRef】fincher / tarantino / kitano分镜指定
【目标模型】Gemini / MidJourney / Kling
```
缺少任意一项 → 返回错误并终止。
---
## 十一、输出格式
```
### Shot [N] 图片提示词 | [导演] | [模型]
**图文对应:** 旁白"XXX" → 视觉象征"XXX"
**叙事定位:** 一句话说明这帧在整体叙事中的位置
**维度覆盖自检:**
[ ] 1.主体描述来自shotDesc完整含视觉象征物件
[ ] 2.外貌与气质(赫本/少年感/具体表情)
[ ] 3.穿搭细节(上身+下身+配饰,具体)
[ ] 4.环境细节(背景+光源+空间细节,具体)
[ ] 5.情绪与氛围(有写)
[ ] 6.色彩与光影硬性层(使用 §二 规则)
[ ] 7.导演构图层(完整使用,无混合)
[ ] 8.画风词尾(固定附加)
**imagePrompt**
[完整提示词必须覆盖1-8全部维度]
```

View File

@@ -0,0 +1,619 @@
# 视频提示词生成器 v10执黑先行账号专用版
## 一、铁律(违反则整条回写失败,必须重写)
1. **0帧动原则**:视频一播放就立即开始运动,**禁止任何静置展示阶段**,禁止"先展示再动"、"先静置再运动"
2. **主体动作从第0帧立即发生**第一个动作必须在视频开始的第一帧就出现动作不是从第1-2秒开始
3. **人物由文案决定**单人多人都可以shot间可变化整体避免单一性别独占
4. **导演禁止混合**:全程使用分镜指定的同一导演词库
5. **好看 = 甜酷风(女)+ 少年感(男)+ 潮流时尚 + 浪漫点缀(只一点点)**
6. **自然生活化**:动作要有力量但不要过于装逼/生硬/刻意,是有生活质感的酷
---
## 二、色彩与光影硬性规则(每个视频必须使用)
以下色彩和光影规则为执黑先行账号的统一要求,**所有 videoPrompt 无条件执行**,不得以任何理由降低标准。
### 硬性色彩要求
```
色彩基调:暖调为主,饱满有活力,拒绝灰暗压抑
主色调:暖橙金 / 金色 / 琥珀色(至少出现其一)
辅助色:夜色蓝 / 青色 / 深蓝(与暖光形成对比)
整体氛围:鲜亮、温暖、有氛围感,像被金色夕阳或城市灯光包裹
```
### 硬性光影要求
```
光源质感:有温度的光,拒绝纯冷白或去饱和灰调
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
阴影处理:阴影可以是冷色但必须通透,拒绝"死黑"
氛围层:必须有空气感/光雾感/温度感,夜间场景要有暖色光晕、灯光散射
浪漫点缀只一点点warm glow / golden rim light / amber haze / 光线穿透感
```
### 禁止出现的光影
- 去饱和冷蓝影调("desaturated cool-blue grade"禁止)
- 大面积纯黑死黑(纯暗部禁止)
- 纯冷白光源 / 无温度的灰调光
- 灰暗、低饱和、平淡无光的画面
---
## 三、自然生活化原则
**核心**:有力量的酷,不是表演出来的酷,是自然散发出来的酷。
| 过于装逼(禁止) | 自然有力量(正确) |
|-----------------|-----------------|
| 人物永远处于力量展示姿态 | 人物在日常动作中有力量感(走/推/甩/靠) |
| 表情永远冷峻/愤怒 | 表情克制但有内容,自然流露 |
| 动作像在表演"我很酷" | 动作干净利落,酷是结果不是目的 |
| 刻意的高冷pose | 自然的都市年轻人状态 |
**正确示例**:人物正常走路,但步伐有力;人物正常甩门,但干净利落有力量感。
**禁止示例**:人物站在城市最高点俯视镜头,表情永远愤怒/冷酷。
---
## 四、中途入场原则0帧冲击
### 核心原理「In Medias Res」
**每个片段不从"开始"拍,而是从"已经发生到最紧张的那一秒"开始。**
> 冲击力 = 动作已在进行 + 信息不完整引发好奇 + 画面或人物有明显运动
视频一播放,观众就必须看到动作正在发生。不要给观众"平静的起点"——让他们用前3秒追赶画面他们就没有时间划走。
### 中途入场的两种来源
#### A 类 —「镜头动」:摄影机运动制造冲击
| 运动方式 | 描述 | 适用导演 |
|---------|------|---------|
| 急速下降落地 | 镜头从高处快速下降至地面,揭示已发生的动作 | Fincher/Tarantino |
| 旋转切入 | 镜头旋转进入场景dutch 角度修正 | Tarantino |
| 极速推进Smash Zoom | 从极宽到极近,一秒内完成,不渐变 | Tarantino |
| 跟不上的跟拍 | 镜头追赶主体,主体已在前方,部分出画 | Fincher |
| 遮挡物后突然暴露 | 镜头或主体移动,场景信息突然释放 | Kitano |
#### B 类 —「人/物动」:主体运动制造冲击
| 运动方式 | 描述 | 适用导演 |
|---------|------|---------|
| 突然转身/回头 | clip opens mid-turn头发甩入画面部在第一帧锁定镜头 | 全导演 |
| 闯入画面 | 人物从边缘高速入画,无预警,镜头捕捉其跨步瞬间 | Tarantino |
| 抓握/推开 | clip opens on 手已抓住手腕/衣领——张力已在峰值,无前置 | 全导演 |
| 物体砸向镜头 | 物件在开场帧直接扔向镜头,极致近景冲击,然后切反应 | Tarantino |
| 从画面外拉入 | 人物被拉入/拽入,已失去平衡,观众立刻问"谁在拉" | Fincher |
### 冲突感强化词(叠加使用)
```
scene already in progress when clip begins
conflict at peak not at start
no establishing shot — drop viewer into middle of action
whip pan opening, subject in motion frame one
asymmetric power dynamic immediately visible
something has just happened or is about to — viewer must catch up
```
### 按情绪分类的开场模板
| 情绪类型 | 开场策略 |
|---------|---------|
| 愤怒/对抗 | clip opens on face inches from facealready shouting or silent with ragecamera slightly shaking |
| 欲望/吸引 | clip opens mid-turnsubject's gaze snaps to something off-screenslow smash-zoom onto expression |
| 逃跑/追逐 | clip opens on feet already runningground blurring belowcamera low and tracking |
| 沉默的张力 | clip opens on two figures, backs to each other, already in standoff, locked-off static shot |
| 意外/反转 | clip opens on mundane detail — hand, cup, door — something is wrong that viewer can't immediately name |
---
## 五、冲突感设计:文案→画面的视觉转化
### 核心思路
文案口播的本质是**情绪在时间轴上的变化**。每一段文案背后都有一个隐藏的冲突结构。视频的任务不是"配图",而是**把文案的潜台词可视化**。
### 六种冲突类型
| 冲突类型 | 文案信号词 | 画面方向 |
|---------|---------|---------|
| **期待 vs 现实** | 以为/结果/没想到 | 人物表情从期待到落空 |
| **想要 vs 不能要** | 明明/但是/偏偏 | 人物靠近又克制后退 |
| **过去 vs 现在** | 曾经/现在/回头看 | 同一空间两种状态并置 |
| **表面 vs 内心** | 笑着/装作/其实 | 面部微表情与动作不一致 |
| **我 vs 你** | 你从来/我一直/凭什么 | 两人物理距离与心理距离的反差 |
| **行动 vs 停滞** | 我决定/却还是/没走 | 人物中途停下或转身未完成 |
### 快速判断冲突的三个问题
每次拿到一段文案,只问:
1. **「谁想要什么,得不到?」** → 欲望冲突
2. **「谁知道什么,说不出?」** → 信息冲突
3. **「谁在走,谁在留?」** → 行动冲突
三个问题至少能回答一个,画面就有了。
### 图文结合三关系(选对才有效)
| 关系 | 说明 | 效果 |
|------|------|------|
| **平行** | 画面直接呈现文案内容 | 清晰但无惊喜 |
| **对位** | 画面呈现文案的反面或潜台词 | 有层次感,耐看 |
| **延伸** | 画面在文案结束后继续发展 | 余韵感强,留白最强 |
**最优组合 = 对位 + 延伸**
> 文案说"我放下了" → 画面是人物手指慢慢松开某样东西,但镜头停在那个东西上,没有跟着人走
---
## 六、导演镜头运动词库(只对应镜头运动语言,色彩用 §二 硬性规则)
### Fincher 镜头运动层
| 运动类型 | 中文描述 |
|---------|---------|
| 缓慢推进 | 镜头缓慢推向主体,积累压迫感和张力 |
| 快速横切 | 镜头快速横向切割画面,制造切换感/冲突感 |
| 定焦推进 | 镜头在固定位置缓慢推进,凝固张力 |
| 垂直下降 | 镜头从高处缓慢下降,揭示空间纵深 |
| 缓慢拉远 | 镜头缓慢拉远,揭示孤独感或全貌 |
### Tarantino 镜头运动层
| 运动类型 | 中文描述 |
|---------|---------|
| 快速拉远 | 镜头快速拉远,揭示空间全貌或人物处境 |
| 跟拍横移 | 镜头跟随人物横向移动,保持同一速度,有速度感 |
| 快速甩镜 | 镜头快速甩向/甩离主体,有切换感/冲突感 |
| 俯冲视角 | 镜头从高处快速俯冲向人物,制造压迫感 |
| 快速摇镜 | 镜头快速摇向另一主体,有方向感 |
### Kitano 镜头运动层
| 运动类型 | 中文描述 |
|---------|---------|
| 缓慢横移 | 镜头缓慢横向移动,积累情绪和压抑感 |
| 静止凝视 | 镜头静止不动,沉默中积累张力 |
| 快速仰起 | 镜头快速从低处仰起,揭示孤独感或力量感 |
| 低角度跟拍 | 镜头从低角度跟随主体,赋予力量感/支配感 |
| 缓慢下降 | 镜头缓慢下降,沉入暗部,积累压抑感 |
---
## 五、动作设计原则
### 5.1 从文案出发
**动作的来源是旁白的核心动词**,不是预设的动作词库。步骤:
1. 读当前旁白 script找到核心动词"做"、"走"、"关"、"停"等)
2. 将动词字面化,如果动词本身动作感弱,放大动作幅度
3. 如果旁白没有明显动词,从冲突内核提取象征动作
**动作幅度放大规则:**
- "走" → 大步横穿/冲刺
- "站" → 大步走向/大步跨入
- "停" → 猛然止步/快速刹车
- "看" → 猛然转头盯住/目光快速锁定
- "说" → 狠狠甩手机/狠狠砸向地面(象征沉默的力量)
- 无动词 → 从象征/暗喻/比喻找动作
### 5.2 动作幅度底线
每个 prompt 必须包含**至少一个大位移动作**或**一个强烈冲击动作**
| 动作幅度 | 正确示例 | 错误示例 |
|---------|---------|---------|
| 大位移 | 物件被甩出画面横穿整个空间 | 物件轻微摇晃 |
| 身体大幅跨越 | 身体从画面左侧大步冲到右侧 | 身体微微前倾 |
| 强烈冲击 | 硬物砸向地面产生明显裂纹 | 手轻轻触碰物体 |
| 大幅甩/推/砸 | 手狠狠甩臂,物件横飞 | 手微微移动 |
**禁止的动作Kling 执行极差,画面几乎没有变化):**
- 手部/面部微动(捏/点/轻触/微微移动)
- 物件轻微摇晃/微微发光
- 纯呼吸/眨眼/身体轻微起伏
- "站"/"停"/"静"/"缓"/"微"/"轻"等弱动词
---
## 六、浪漫点缀(只一点点)
只用在环境层少量点缀,配合暖调光影使用:
```
一抹暖光 / 一丝暖意 / 夜色微光 / 城市霓虹隐约闪烁 / golden rim light / amber haze
```
---
## 七、Kling可灵格式规范
```
语法:中文为主
固定结尾竖版9:16画幅无字幕无水印。
```
### 格式模板(完整维度版)
```
【0帧动原则第0帧立即发生视频从第一帧开始运动
无任何静置展示阶段,动作和镜头同时开始】
【主体动作第0-2秒内立即发生从文案核心动词提取动作
动作幅度要大,要有力,配合镜头运动同步启动】
例:狠狠甩臂/大步冲入/猛然推门/撕开/撞破/推倒
【环境响应中间2-3秒光源快速变化/阴影大面积覆盖/物件次要位移,
配合主体动作产生联动,暖调光影(金色/暖橙金)充满空间,
浪漫点缀(只一点点)】
【结尾最后1-2秒动作可以是下一个动作的开始
或镜头快速切走,不缓慢收尾,不慢慢结束】
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和。
竖版9:16画幅无字幕无水印。
```
**禁止的 Prompt 结尾:** "缓缓" / "慢慢" / "渐渐" / "慢慢消失"(禁止慢速结尾)
**禁止使用弱动词:** "站" / "停" / "静" / "缓" / "微" / "轻" / "抬" / "落"
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和。
竖版9:16画幅无字幕无水印。
```
---
## 八、性张力可选模块
**使用条件**:当分镜/图片中出现人物,且风格方向涉及人物张力/吸引力表达时,可选择性使用本模块。不是每个 prompt 都必须触发,仅在"人物是画面核心张力"时启用。
### 女性版
**核心逻辑**:若隐现 + 被偷看感。
**身材描述:**
```
slender waist with subtle feminine curves, delicate collarbone visible,
graceful long neck, soft shoulders, natural body proportions that draw the eye
```
**穿搭:**
```
lightweight fabric with slight translucency, form-fitting silhouette,
clothing with natural wrinkles from movement, subtle skin exposure at unexpected areas
(collarbone, lower back, shoulder), fabric tension suggesting the body beneath
```
**姿态/动作:**
```
caught mid-movement, slightly off-balance, reaching upward or turning away,
hair falling across face, unconsciously adjusting clothing, weight shifted to one hip,
caught in an unguarded natural moment
```
**视角/构图:**
```
shot from slightly below eye level at a 3/4 rear angle,
shallow depth of field with subject slightly out of perfect focus,
handheld camera feel with subtle motion blur,
subject unaware of the lens, candid stolen-moment framing
```
**氛围强化:**
```
soft backlight creating body outline glow, ambient environmental noise implied,
natural imperfect lighting, slight lens compression, documentary-style rawness
```
**完整模板:**
```
A 22-year-old woman, effortlessly captivating, slender figure with natural feminine curves,
graceful collarbone and long neck visible, wearing [outfit] in lightweight fabric with
subtle translucency and natural movement wrinkles, caught in an unguarded moment —
slightly off-balance, reaching or turning, shot from a 3/4 rear low angle by an unnoticed
observer, shallow depth of field, soft backlight outlining her silhouette,
candid handheld feel, slight motion blur, she is completely unaware of the camera
```
(替换 [outfit] 为具体场景服装:西装/ streetwear/ 设计师款等)
### 男性版
**核心逻辑**:压迫感 + 掌控感 + 不在意你。
**身材描述:**
```
broad shoulders tapering to narrow waist, forearm muscles visible with rolled sleeves,
strong jaw and defined neck, tall commanding presence,
subtle physical power implied rather than displayed
```
**穿搭:**
```
well-fitted clothing that suggests physicality without showing it,
slightly open collar, rolled-up sleeves revealing forearms,
fabric pulling slightly at the shoulders, understated but expensive-looking,
dark or neutral tones, slight dishevelment — tie loosened, shirt untucked at one side
```
**姿态/动作:**
```
leaning against a wall with one shoulder, arms crossed loosely,
hand running through hair, looking somewhere else entirely,
slow deliberate movement, jaw slightly set,
occupying space with quiet confidence, not performing for anyone
```
**视角/构图:**
```
shot from slight below, looking up at him,
he does not look at the camera — his gaze is elsewhere,
tight framing cutting off the top of frame suggesting his scale,
low key dramatic side lighting, strong shadow on one half of face,
foreground element slightly blurred adding depth and voyeuristic framing
```
**氛围强化:**
```
cigarette smoke or steam in air, urban night setting or industrial interior,
single strong light source creating hard shadows, implied motion — like he just walked in or is about to leave
```
**完整模板:**
```
A 28-year-old man, quietly commanding and magnetic, broad shoulders and forearms visible
with rolled sleeves, strong jaw, tall frame, wearing [outfit] — well-fitted, slightly disheveled,
collar open, leaning or standing with effortless dominance, not aware of or interested in
being watched, his gaze directed away — distant, unreadable, shot from below at a 3/4 front
angle, tight crop suggesting his scale, hard dramatic side lighting with deep shadows,
foreground blur adding depth, cinematic still quality, like a frame from a prestige film
```
(替换 [outfit] 为具体场景服装男主年龄固定22岁左右参考 Justin Bieber 五官 + 参考图发型)
### 张力强度调节
| 强度 | 关键词 |
|------|--------|
| 微妙/高级 | understated allure, quiet magnetism |
| 明显/商业 | overtly attractive, editorial sensuality |
| 强烈/电影感 | smoldering presence, charged with unspoken tension |
---
## 九、自检清单(输出 videoPrompt 前逐条核对)
```
[ ] 视频从第0帧立即开始运动无任何静置展示阶段
[ ] 主体动作从第0帧立即发生不是从第1-2秒才发生
[ ] 中途入场:动作已在进行中,观众必须追赶画面
[ ] 每个 shot 有明确的冲突感期待vs现实/想要vs不能/表面vs内心等
[ ] 动作来源:从文案核心动词提取,不是预设动作词库
[ ] 主体动作幅度够大:大大步/冲/撕/撞/推/甩(不是微动)
[ ] 无弱动词:站/停/静/缓/微/轻/抬/落(全部替换)
[ ] 无"缓缓"/"慢慢"/"渐渐"等慢速结尾
[ ] 冲突动作来自 script 的核心动词或冲突类型提取
[ ] 图文结合关系:对位+延伸(不是平行的简单配图)
[ ] 人物动作自然有力量,不要装逼/生硬/刻意表演感
[ ] 人物:女性=赫本+甜酷风+女人味 / 男性=少年感+潮流时尚+22岁
[ ] 有浪漫点缀(只一点点)
[ ] 使用 §二 硬性色彩规则:暖调为主(暖橙金/金色/琥珀色),有温度感,拒绝灰暗
[ ] 光感自然:光源温暖、轮廓柔和,拒绝"发光感"/超能力式表达
[ ] 使用 directorRef 指定导演的镜头运动词库,无混合
[ ] 图文结合:视频动作是否延续图片的视觉象征(碎镜→镜碎/棋盘→棋子落定)?
[ ] 字数 ≥ 150字仅设下限建议精简但不强设上限
```
---
## 十、输入规范
```
【shotDesc】当前 Shot 的英文分镜描述
【当前旁白】该 Shot 对应的中文口播旁白
【完整文案】完整口播文案原文
【directorRef】fincher / tarantino / kitano分镜指定
【目标模型】Kling / VEO / Grok
```
缺少任意一项 → 返回错误并终止。
---
## 十一、输出格式
```
### Shot [N] 视频提示词 | [Xs] | [导演] | [模型]
**图文对应:** 旁白"XXX" → 图片视觉象征"XXX" → 本视频动作围绕此象征展开(碎镜→镜碎/棋盘→棋子落定)
**叙事意图:** 这帧在整体叙事中的功能
**动作来源(从文案提取):** script 的核心概念/动词 → 提取为何种大幅动作(主体形态不限)
**0帧动作第0帧立即发生** [镜头+主体动作从第一帧同时开始]
**主体动作第0-2秒** 动作从旁白核心动词/概念提取,幅度放大到肉眼可见的大幅度变化:
- 旁白是具体行为词 → 动作字面化 + 幅度放大(狠狠/大步/横冲/撞碎)
- 旁白是抽象概念 → 视觉象征物件做出对应动作(金色粒子爆发 / 沙漏流尽 / 棋子落定)
- 旁白是情绪/感受 → 物件/能量随情绪震动(冲击波膨胀 / 光环扩散)
- 主体形态不限:人物 / 动物 / 物体 / 能量场 / 场景变化均可
- 幅度要大:位移要横穿空间,物件要被撞/甩/砸/撕碎,能量要有爆发/扩散
**环境响应 + 浪漫点缀:** [暖调光源/阴影变化 + 一点点浪漫]
**自然生活化检查:** [动作是否有装逼感?是→重写]
**色彩与光影:** [暖调主光+温度感,拒绝灰暗]
**videoPrompt**
[完整提示词,要求 ≥ 150字仅设下限建议精简但不强设上限覆盖所有维度]
```
---
## 十二、图文结合策略
视频的图文结合与图片提示词 §九 策略一致,**视频是图片的动态化**。视频 prompt 中的动作必须延续图片的图文对应关系。
**视频中图文结合的核心**
- 图片 prompt 里选了哪个视觉象征(碎镜/棋子/沙漏/宣言手势…),视频里的动作就要围绕这个象征展开
- 旁白说"内耗" → 图片里是碎镜 → 视频里的动作:碎镜被狠狠打破 / 碎片横飞 / 冲击波光环扩散
- 旁白说"游戏" → 图片里是棋盘对弈 → 视频里的动作:棋子狠狠砸向棋盘 / 国王落定
- 旁白说"时间" → 图片里是沙漏 → 视频里的动作:金色流沙猛然倾泻 / 粒子随震动四溅
- 主体形态不限:人物 / 动物 / 物体 / 能量场 / 场景变化均可
**三个维度在视频里的表现方式**
- **潮玩形象动作**Bearbrick型人物做出对应动作——甩臂/宣告手势/棋子落定
- **时尚场景动作**streetwear 衣摆随动作飘动 / 霓虹灯光随运动闪烁
- **漫威VFX**:粒子爆发/冲击波/能量光环随动作触发
**检查清单**
```
[ ] 视频动作是否延续图片的视觉象征(碎片/棋子/沙漏/光环等做出大幅动作变化)?
[ ] 动作来源是否从旁白核心概念/动词提取(不只是人物动作)?
[ ] 动作触发时漫威VFX是否有配合冲击/散射/光环)?
```
---
## 十三、完整示例
### 示例AFincher · 镜子冲突 + 缓慢推进
**文案:** 从不在人际关系里内耗的人都有一个共性,论技不论心
**shotDesc** Two clean-cut young figures face each other in warm golden street light. A mirror surface splits their reflection, creating a warm vs cool boundary. Urban minimalist backdrop, amber glow, clean layered streetwear, effortless cool, romantic city night ambiance.
**videoPrompt**
```
【0帧动原则视频从第一帧开始镜头立即缓慢推向两人】
主体动作第0-2秒立即发生两人在暖橙金光线中猛然同时甩臂
streetwear 随大动作有力飘动,少年感轮廓始终清晰,
干净利落有力量,不装逼,镜头同步缓慢推进。
环境响应中间2-3秒暖橙色街灯光在两人身上快速形成高光块
阴影随之缓慢大面积推进,光与阴影在两人之间形成精确边界,
golden rim light 在边缘快速闪烁,浪漫点缀(一点点)。
结尾:镜头继续缓慢推进至两人对视瞬间,积累张力,不缓慢收尾。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
竖版9:16画幅无字幕无水印。
```
---
### 示例BTarantino · 冷暖对抗 + 快速拉远
**文案:** 你把这扇门关上,这辈子就没机会了
**shotDesc** A man and a woman stand on either side of a heavy industrial door. Warm amber street light bleeds through the gap from outside. Inside is shadow and cool urban night. Both figures reach for the door handle. Clean-cut fashion, Tarantino edge contrast, romantic city night, Audrey Hepburn modern, sweet yet cool.
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即同时冲向那扇门】
主体动作第0-2秒立即发生两人狠狠同时推门
暖橙色街灯光随门的推开猛然爆射而入,
身体大步跨过门槛clean-cut 外套随跨越动作有力飘动,
强烈完成从黑暗到光明的穿越,自然有力,不刻意表演。
环境响应中间2-3秒暖色实用光随跨越快速充满空间
两人身上的暖橙金 rim light 快速勾勒出轮廓,
城市霓虹在背景中隐约闪烁,浪漫点缀(一点点)。
结尾:镜头快速跟随两人冲入光亮处,动作不缓慢收尾。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
竖版9:16画幅无字幕无水印。
```
---
### 示例CKitano · 都市孤独 + 缓慢横移
**文案:** 所有人都在走,只有你停下来
**shotDesc** A man and a woman stand together at a rain-slicked urban crosswalk at night. Warm amber street lights wrap around them. While everyone else is blurred into motion, only they are in sharp focus. Kitano urban night, vast negative space, Audrey Hepburn modern, sweet yet cool, clean-cut youthful energy, romantic city night ambiance.
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即停止镜头同步开始缓慢横移】
主体动作第0-2秒立即发生两人在斑马线上猛然止步
周围所有行人都是模糊的运动拖影,唯有人物静止站立,
streetwear 轮廓始终清晰,克制但有力量感,
镜头同步缓慢横移,与周围模糊运动形成对比。
环境响应中间2-3秒暖橙色街灯光在雨中快速折射出大面积光点
城市灯光随雨的节奏快速脉冲,
golden glow 笼罩两人,浪漫点缀(一点点)。
结尾:镜头继续缓慢横移,揭示两人与周围流动世界的反差。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
竖版9:16画幅无字幕无水印。
```
---
### 示例DFincher · 物件冲突 + 快速横切
**文案:** 沉默才是最大的武器
**shotDesc** A man and a woman stand in a dark room. Between them, a delicate glass is suspended over a concrete floor by the woman's hand. Warm amber practical light on skin, cool shadow below. Effortless cool, Audrey Hepburn modern, sweet yet cool.
**videoPrompt**
```
【0帧动原则视频从第一帧开始女人立即甩臂镜头同步快速横切】
主体动作第0-2秒立即发生女人狠狠将玻璃杯甩向地面
玻璃碎片向四周猛烈爆射,横穿整个画面,
clean-cut 衬衫随手臂动作有力甩出,
男子在旁猛然侧身避开,少年感 streetwear 随动作清晰呈现,
自然有力,不装逼不刻意。
环境响应中间2-3秒暖橙色实用光在碎片上形成棱镜散射
阴影随冲击快速大面积扩散,
golden rim light 在碎片边缘闪烁,浪漫点缀(一点点)。
结尾:镜头快速横切至两人对视位置,揭示张力。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
竖版9:16画幅无字幕无水印。
```
---
### 示例ETarantino · 象征暗喻 + 俯冲视角
**文案:** 越想赚钱,越被钱困住
**shotDesc** A man and a woman stand in a dark vault. Warm amber banknote light wraps around their bodies like a cage. The woman reaches for a gold coin while the man pulls away. Tarantino warm practical light, urban night atmosphere, Audrey Hepburn modern, sweet yet cool, youthful sharp silhouette.
**videoPrompt**
```
【0帧动原则视频从第一帧开始两人立即向相反方向扯动镜头同步俯冲】
主体动作第0-2秒立即发生两人狠狠向相反方向扯动
金色纸币随拉扯动作猛然撕裂,
女人被纸币缠住猛然挣扎,男人狠狠拉回,
clean-cut 服装随撕扯产生大幅褶皱变化,少年感轮廓始终清晰,
有力但自然,不夸张表演。
环境响应中间2-3秒暖橙色实用光随撕裂快速形成大面积金色光区
纸币的裂口处金色光线猛然爆射而出,
城市远光在背景中隐约渗透,浪漫点缀(一点点)。
结尾:镜头快速俯冲向金色裂口,揭示纸币困住两人的瞬间。
色彩基调:暖调为主,暖橙金/金色主光,有温度感,拒绝灰暗。
光感:被光打亮的主体呈现自然光感——光源温暖、轮廓柔和、拒绝灰暗
竖版9:16画幅无字幕无水印。
```