Files
video-create/.claude/skills/video-from-script/references/storyboard-rules.md
sion123 001d28f4c6 feat(video-from-script): 将分镜规划与提示词生成规则抽取为独立引用文件
将 SKILL.md 中内联的分镜规划规则和提示词生成规则分别抽取为独立的 `storyboard-rules.md` 和 `prompt-rules.md` 引用文件,减少主文档体积并支持子 Agent 独立读取执行。同时修复 manifest 前缀生成使用 account name 而非 ID。
2026-04-29 23:38:56 +08:00

2.6 KiB
Raw Blame History

分镜规划规则

分镜是纯叙事思考,与视觉风格无关。 拿到文案后、读风格文件之前,先完成分镜。

短视频的画面节奏和文案节奏是脱钩的TTS 配音连续流淌,画面在配音下面切换。分镜规划的是视觉节拍,不是文字断句。

输入输出

  • 输入:用户文案 + 约束时长、shot 数、特殊要求)
  • 输出结构化分镜表JSON 数组)

时长规划

分镜前先算数:

  • 短视频目标时长20-60 秒
  • 每个 shot 时长6-8 秒(由视频模型决定)
  • shot 数量 = 目标时长 / 6~8取整一般 4-8 个 shot
  • 配音字数 ≈ shot 数 x 12-15 字(按正常语速)

分镜表字段

字段 类型 说明
text string 该 shot 覆盖的配音文案(可能不到一句,也可能跨句)
shotType enum wide / medium / close-up / extreme-close-up
cameraMove enum static / zoom-in / zoom-out / pan-left / pan-right / dolly-in / tracking
visualDesc string 画面描述(中文),只写三件事:主体是什么、什么状态/动作、视觉焦点在哪。氛围和构图交给风格层
hook boolean 仅 shot 1 为 true标记是否为开场钩子

景别节奏

shot 1 (hook):    close-up 或 extreme-close-up强主体抓眼球
shot 2:           wide 或 medium展开场景给上下文
shot 3-N交替: close-up→ wide→ close-up→ ...
最后一个 shot:    medium 或 wide收束不过度设计

不要用 extreme-close-up 收尾(太紧),不要用 tracking 滥用(信息密度低)。

镜头运动选择

cameraMove 情绪 典型场景
static 稳定、庄严 建筑、静物、仪式感
zoom-in 聚焦、压迫 悬疑、揭秘、强调细节
zoom-out 揭示、震撼 从局部拉出全景,揭示真相
pan-left/right 环顾、流动 展示空间、物品陈列
dolly-in 沉浸、紧张 人物面部、关键物件
tracking 跟随、活力 运动场景、行走少用AI 生成的 tracking 质量不稳定)

短视频默认转场是硬切不需要单独字段。特殊转场fade/dissolve仅在判断需要情绪转换时标注在 visualDesc 里。

首尾帧额外规则

首尾帧模式下分镜需要额外注意:

  • 每个 shot 必须能拆为两个有状态对比的画面(起始帧 / 结束帧)
  • visualDesc 需描述状态变化方向:从什么状态到什么状态
  • 首尾帧必须在同一场景,仅状态不同