将 SKILL.md 中内联的分镜规划规则和提示词生成规则分别抽取为独立的 `storyboard-rules.md` 和 `prompt-rules.md` 引用文件,减少主文档体积并支持子 Agent 独立读取执行。同时修复 manifest 前缀生成使用 account name 而非 ID。
60 lines
2.6 KiB
Markdown
60 lines
2.6 KiB
Markdown
# 分镜规划规则
|
||
|
||
**分镜是纯叙事思考,与视觉风格无关。** 拿到文案后、读风格文件之前,先完成分镜。
|
||
|
||
短视频的画面节奏和文案节奏是脱钩的:TTS 配音连续流淌,画面在配音下面切换。分镜规划的是**视觉节拍**,不是文字断句。
|
||
|
||
## 输入输出
|
||
|
||
- **输入**:用户文案 + 约束(时长、shot 数、特殊要求)
|
||
- **输出**:结构化分镜表(JSON 数组)
|
||
|
||
## 时长规划
|
||
|
||
分镜前先算数:
|
||
- 短视频目标时长:20-60 秒
|
||
- 每个 shot 时长:6-8 秒(由视频模型决定)
|
||
- shot 数量 = 目标时长 / 6~8(取整,一般 4-8 个 shot)
|
||
- 配音字数 ≈ shot 数 x 12-15 字(按正常语速)
|
||
|
||
## 分镜表字段
|
||
|
||
| 字段 | 类型 | 说明 |
|
||
|------|------|------|
|
||
| `text` | string | 该 shot 覆盖的配音文案(可能不到一句,也可能跨句) |
|
||
| `shotType` | enum | `wide` / `medium` / `close-up` / `extreme-close-up` |
|
||
| `cameraMove` | enum | `static` / `zoom-in` / `zoom-out` / `pan-left` / `pan-right` / `dolly-in` / `tracking` |
|
||
| `visualDesc` | string | 画面描述(中文),只写三件事:**主体是什么、什么状态/动作、视觉焦点在哪**。氛围和构图交给风格层 |
|
||
| `hook` | boolean | 仅 shot 1 为 true,标记是否为开场钩子 |
|
||
|
||
## 景别节奏
|
||
|
||
```
|
||
shot 1 (hook): close-up 或 extreme-close-up,强主体,抓眼球
|
||
shot 2: wide 或 medium,展开场景,给上下文
|
||
shot 3-N(交替): close-up(压)→ wide(松)→ close-up(压)→ ...
|
||
最后一个 shot: medium 或 wide,收束,不过度设计
|
||
```
|
||
|
||
不要用 extreme-close-up 收尾(太紧),不要用 tracking 滥用(信息密度低)。
|
||
|
||
## 镜头运动选择
|
||
|
||
| cameraMove | 情绪 | 典型场景 |
|
||
|------------|------|---------|
|
||
| `static` | 稳定、庄严 | 建筑、静物、仪式感 |
|
||
| `zoom-in` | 聚焦、压迫 | 悬疑、揭秘、强调细节 |
|
||
| `zoom-out` | 揭示、震撼 | 从局部拉出全景,揭示真相 |
|
||
| `pan-left/right` | 环顾、流动 | 展示空间、物品陈列 |
|
||
| `dolly-in` | 沉浸、紧张 | 人物面部、关键物件 |
|
||
| `tracking` | 跟随、活力 | 运动场景、行走(少用,AI 生成的 tracking 质量不稳定) |
|
||
|
||
短视频默认转场是硬切,不需要单独字段。特殊转场(fade/dissolve)仅在判断需要情绪转换时标注在 `visualDesc` 里。
|
||
|
||
## 首尾帧额外规则
|
||
|
||
首尾帧模式下分镜需要额外注意:
|
||
- 每个 shot 必须能拆为两个有状态对比的画面(起始帧 / 结束帧)
|
||
- `visualDesc` 需描述状态变化方向:从什么状态到什么状态
|
||
- 首尾帧必须在**同一场景**,仅状态不同
|