Files
video-create/.claude/skills/image-generator/references/batch-mode.md
sion123 96f00ce7fd feat(video-pipeline): 将 narration 字段统一重命名为 script
字段重命名涉及所有文档、示例代码、提示词模板以及 slug 生成逻辑,确保管线各阶段(分镜、图生提示词、TTS、成片)一致使用 script 字段承载口播文案。

同时增强 `capcut_assemble.js` 的配音与字幕模块:
- 配音支持本地路径模式(不上传 OSS),新增 `--split-captions` 参数启用分句字幕
- 分句字幕按标点切分长文本为短句,基于字数权重动态分配显示时长
- 新增 `update-captions-standalone.js` 独立工具,可在草稿已生成后单独更新字幕
2026-05-01 02:48:37 +08:00

2.8 KiB
Raw Blame History

批量图片生产

流程

digraph batch_gen {
  rankdir=LR
  node [shape=box, style=filled, fillcolor="#f5f5f5", fontsize=11]

  refs [label="参考图 references/\n+ 风格 styles/*.md", shape=folder, fillcolor="#e3f2fd"]
  prompts [label="生成提示词\n每条文案→imagePrompt\n+ videoPrompt"]
  model_gemini [label="Gemini edit()\n图生图参考图直传", fillcolor="#e8f5e9"]
  model_mj [label="MJ --sref\n风格参考URL", fillcolor="#fff3e0"]
  output [label="输出图片\n+ manifest.json"]
  pick [label="人工挑选\n删除不合格变体", shape=diamond, fillcolor="#fff9c4"]

  refs -> prompts
  prompts -> model_gemini [label="快速/批量"]
  prompts -> model_mj [label="精品/写实"]
  model_gemini -> output
  model_mj -> output
  output -> pick
}

提示词生成

单图模式(默认)

每条文案生成 2 个 prompt

字段 用途 规则
imagePrompt 生图 英文,描述画面内容
videoPrompt 图生视频 描述运动zoom/pan/dolly不超过 50 词

首尾帧模式(用户指定时)

每条文案生成 3 个 prompt

字段 用途 规则
imagePrompt 起始帧 静止状态
lastFramePrompt 结束帧 同一场景的运动状态
videoPrompt 过渡视频 "from X to Y" 格式

首尾帧原则:同一场景、视角一致、状态对比、光照连贯。

输出目录

output/{name}_{YYYYMMDD}_{NNN}/
├── manifest.json       # 主清单(贯穿全流程)
├── images/             # scene_{NN}_{slug}.jpeg
├── videos/             # scene_{NN}_{slug}.mp4
└── audio/              # seg_001.mp3

命名:图片 scene_01_悬浮.jpeg → 视频 scene_01_悬浮.mp4slug 从 script/shotDesc 派生,支持中文)

manifest.json

字段规范详见 manifest-schema.md

命令速查

# Gemini 图生图(推荐,本地图直传)
node scripts/gemini-image-generator.js edit "prompt" -i ./references/ref1.png -o ./output -r 9:16

# Pipeline 批量生图(推荐)
node scripts/pipeline.js init \
  --account {account} --mode single \
  --items '[{"shotDesc":"...","script":"...","duration":5,"imagePrompt":"...","directorRef":"tarantino"}]'
node scripts/pipeline.js run \
  --manifest ./output/{account}_XXXXXXXX_001/manifest.json \
  --phase images

# MJ 带参考图(需先上传 OSS
node scripts/oss-upload.js ./references/ref1.png
node scripts/mj-image-generator.js "prompt --sref URL --sw 200" -o ./output -a 9:16

# Gemini 纯文生图(无参考图时)
node scripts/gemini-image-generator.js generate "prompt" -o ./output -r 9:16

质量检查

  • 画幅比例正确9:16/16:9
  • manifest.json 与实际文件一一对应
  • 生成数量与文案数量匹配