Files

sion123 001d28f4c6 feat(video-from-script): 将分镜规划与提示词生成规则抽取为独立引用文件

将 SKILL.md 中内联的分镜规划规则和提示词生成规则分别抽取为独立的 `storyboard-rules.md` 和 `prompt-rules.md` 引用文件，减少主文档体积并支持子 Agent 独立读取执行。同时修复 manifest 前缀生成使用 account name 而非 ID。

2026-04-29 23:38:56 +08:00

2.6 KiB

Raw Blame History

分镜规划规则

分镜是纯叙事思考，与视觉风格无关。 拿到文案后、读风格文件之前，先完成分镜。

短视频的画面节奏和文案节奏是脱钩的：TTS 配音连续流淌，画面在配音下面切换。分镜规划的是视觉节拍，不是文字断句。

输入输出

输入：用户文案 + 约束（时长、shot 数、特殊要求）
输出：结构化分镜表（JSON 数组）

时长规划

分镜前先算数：

短视频目标时长：20-60 秒
每个 shot 时长：6-8 秒（由视频模型决定）
shot 数量 = 目标时长 / 6~8（取整，一般 4-8 个 shot）
配音字数 ≈ shot 数 x 12-15 字（按正常语速）

分镜表字段

字段	类型	说明
`text`	string	该 shot 覆盖的配音文案（可能不到一句，也可能跨句）
`shotType`	enum	`wide` / `medium` / `close-up` / `extreme-close-up`
`cameraMove`	enum	`static` / `zoom-in` / `zoom-out` / `pan-left` / `pan-right` / `dolly-in` / `tracking`
`visualDesc`	string	画面描述（中文），只写三件事：主体是什么、什么状态/动作、视觉焦点在哪。氛围和构图交给风格层
`hook`	boolean	仅 shot 1 为 true，标记是否为开场钩子

景别节奏

shot 1 (hook):    close-up 或 extreme-close-up，强主体，抓眼球
shot 2:           wide 或 medium，展开场景，给上下文
shot 3-N（交替）: close-up（压）→ wide（松）→ close-up（压）→ ...
最后一个 shot:    medium 或 wide，收束，不过度设计

不要用 extreme-close-up 收尾（太紧），不要用 tracking 滥用（信息密度低）。

镜头运动选择

cameraMove	情绪	典型场景
`static`	稳定、庄严	建筑、静物、仪式感
`zoom-in`	聚焦、压迫	悬疑、揭秘、强调细节
`zoom-out`	揭示、震撼	从局部拉出全景，揭示真相
`pan-left/right`	环顾、流动	展示空间、物品陈列
`dolly-in`	沉浸、紧张	人物面部、关键物件
`tracking`	跟随、活力	运动场景、行走（少用，AI 生成的 tracking 质量不稳定）

短视频默认转场是硬切，不需要单独字段。特殊转场（fade/dissolve）仅在判断需要情绪转换时标注在 visualDesc 里。

首尾帧额外规则

首尾帧模式下分镜需要额外注意：

每个 shot 必须能拆为两个有状态对比的画面（起始帧 / 结束帧）
visualDesc 需描述状态变化方向：从什么状态到什么状态
首尾帧必须在同一场景，仅状态不同

2.6 KiB Raw Blame History Unescape Escape