sion/video-create - video-create - Gitea: Git with a cup of tea

sion/video-create

Author	SHA1	Message	Date
lc	6eec0e8889	feat(skills): 完善视频生产 pipeline 及新增健身跟练账号 - SKILL.md: 新增工作流阶段定义、质量卡点、分镜规则 - manifest-schema.md: 补充完整字段规范及类型定义 - phase-tts.js: 优化 TTS 合成长逻辑，添加进度追踪 - capcut-tracks.js: 扩展轨道构建能力，支持更多元素类型 - capcut-timeline.js: 改进时间线生成，支持淡入淡出 - capcut_assemble.js: 新增 assemble 阶段完整实现 - cmd-init.js: 完善 init 命令逻辑 - qwen-tts.js: 调整超时配置 - accounts/禁忌帝王学: 更新拆分/图像/台词提示词 - accounts/健身跟练: 新增账号含 account.json 及全套提示词模板 - 新增 workflow-issues-20260501.md 参考文档 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-06 22:53:37 +08:00
sion123	6097a809bf	refactor(video-pipeline): 移除 segments 机制，改为整段音频合成移除 TTS 阶段逐句切分及 segments 数组逻辑，统一为整段音频合成。 CapCut 字幕切分由组装阶段按字符比例分配，简化音频上传、时间线构建和字幕生成流程，减少冗余处理分支。	2026-05-02 02:31:55 +08:00
sion123	0998fd6ae1	feat(video-pipeline): 重构视频流水线，优化成片时间线规则和状态管理 - 引入 manifest.json 作为唯一状态源，所有子 Agent 操作回写 manifest - 重构 timebuilder 逻辑，支持四种视频适配策略（加速/裁剪/放缓/画面停顿） - 统一 TTS 阶段输出结构，单句和多句均写入 segments[] - 重写字幕和配音生成，基于 segments 精确时长实现音画同步 - 新增 confirm 命令支持按 id 范围确认，上传阶段分离图片和视频 - 添加中间产物写入 output/ 目录的约束，清理废弃配置参数	2026-05-02 00:14:40 +08:00
sion123	9d19437a29	feat(video-pipeline): 实现 TTS 逐句分句生成与字幕精确对齐 TTS 阶段将长文本按标点切分为短句，逐句生成音频并记录每句时长到 `item.segments[]`。assemble 阶段优先使用 segments 的精确时长分配字幕时间线，无 segments 时回退到字数权重估算。同时优化音频上传流程，支持分段音频独立上传 OSS 并在配音时按段映射时间线。	2026-05-01 14:41:28 +08:00
sion123	f5d47ec5db	feat(video-pipeline): 添加可配置的转场策略引擎和TTS语速支持 - 引入转场策略系统（`getTransition`），支持 `fixed`、`director`、`rhythm` 三种模式 - 根据账号配置文件动态读取转场配置（`loadTransitions`） - 图片和视频轨道分别调用转场策略，替代原有的固定“闪白”转场 - 支持 `byPosition`（hook/body/keypoint/closing）和 `byDirector` 两种高级选择策略 - 图片动画支持 `loop_animation` 与 `in_animation` 解析（“缩放”、“弹入”等组合） - TTS 合成新增 `rate` 字段（源自账号配置 `ttsRate`），默认语速调整为 1.1 - 默认动画类型从 `kenburns-zoom` 改为 `缩放`，适配中文 CapCut	2026-05-01 14:16:08 +08:00
sion123	c878abc39b	feat(video-pipeline): 用 ffprobe 实际测量音视频时长并统一字段名为 script 将项目中的 `narration` 字段统一重命名为 `script`，并新增 `getAudioDurationSec` 函数通过 `ffprobe` 实际测量音频和视频文件的时长，替代 Manifest 中的估计值，提高时间线组装的准确性。同时优化字幕逻辑，仅在有 TTS 音频时调整视频速度。	2026-05-01 01:52:02 +08:00
sion123	7d526d2b60	feat(video-pipeline): 重构多阶段生成管线并集成 CosyVoice TTS - 重写 `phase-images`：改为并发 3 张并行生成，每个 item 完成立即写入 manifest，支持 MJ task ID 恢复 - 重写 `phase-videos`：先恢复已有 task ID 再提交新任务（并发 3），支持中断恢复 - 迁移 TTS 引擎：从 Qwen-TTS HTTP 接口切换为 CosyVoice WebSocket 接口，支持音色/语气参数透传 - 精简账号系统：移除 `styles/` 目录、`taskId` 过滤和 `--id` 正则校验，`references` 改为顶层字段 - 调整 `slugify`：限制中文字符 5 个、其他 10 个，避免文件名过长 - 更新文档：`manifest-schema.md` 中 `narration` 改为完整原文案，`account-creation.md` 新增 TTS 配置项 - 配置更新：默认 TTS 模型切换为 `cosyvoice-v3.5-plus`，新增 `localAudio` 参数	2026-05-01 00:44:18 +08:00
sion123	86b9b7948d	feat(video-from-script): 重构工作流为子Agent分步执行并新增提示词模板系统将视频制作工作流拆分为独立子步骤：分镜 → 图片提示词 → 生图 → 视频提示词 → 生视频 → 成片，每步由子Agent独立执行。引入prompts/目录统一管理提示词模板（分镜.md、图片提示词.md、视频提示词.md），通过account.json的storyboardPrompt/imageStylePrompt/videoStylePrompt字段引用。变更内容： - 新增confirmed机制和pipeline.js confirm命令，生图后必须人工确认才能继续 - manifest schema改用shotDesc/narration/duration/directorRef替代旧字段 - 文件命名规则从keyword改为slug（从shotDesc/narration派生） - 删除旧的storyboard-rules.md和prompt-rules.md - pipeline.js脚本拆分为lib/目录下的独立模块（cmd-init/cmd-confirm/cmd-validate/phase-*） - 新增cmd-create-account支持一键创建带prompts目录的账号 - capcut_assemble支持narration字段替代text作为字幕源 - 新增.gitclaude/settings.json权限配置	2026-04-30 21:18:31 +08:00