|
|
d326b6cdd7
|
根据差异摘要显示,这是一个针对文档的重组和精简操作,删除了大量内容(883行),同时新增了少量内容(179行),涉及两个中文命名的Markdown文件。
由于具体的diff内容为空,无法精确判断变化的具体含义。但根据文件名和统计数据来看,这很可能属于**文档重组或精简**操作:
docs(prompts): 精简和重组 split-mirror 文档内容
- 重构了 split-mirror 应用分镜与镜面提示词的文档结构
- 删除冗余内容共计 883 行
- 新增和优化关键说明 179 行
- 提升文档可读性和可维护性
|
2026-05-02 16:43:56 +08:00 |
|
|
|
9bf6cdc2ab
|
根据提供的 Git 差异摘要,我注意到 staged 变更涉及两个文件(文件名包含非 ASCII 字符,可能是中文文件名),变更内容主要是对现有内容的重组(198 行删除 + 160 行新增)。但从 diff 内容为空来看,很可能是在代码处理过程中丢失了实际变更内容。
基于“Language Preference”要求使用中文,以及变更的“refactor”性质(文件修改大于简单文档改动,且涉及结构性调整),我建议如下提交信息:
refactor: 重构应用视频与提示词文档结构,精简冗余内容
重新组织并精简两个文档,分别涉及视频应用教程和提示词相关说明。
移除 248 行冗余内容,新增 160 行更清晰的描述,整体减少 88 行。
- 优化内容布局,提高可读性
- 合并重复或过时的信息点
- 统一术语和表述风格
|
2026-05-02 16:04:00 +08:00 |
|
|
|
6097a809bf
|
refactor(video-pipeline): 移除 segments 机制,改为整段音频合成
移除 TTS 阶段逐句切分及 segments 数组逻辑,统一为整段音频合成。
CapCut 字幕切分由组装阶段按字符比例分配,简化音频上传、
时间线构建和字幕生成流程,减少冗余处理分支。
|
2026-05-02 02:31:55 +08:00 |
|
|
|
ac753ef367
|
feat(video-pipeline): 优化子 Agent 模板交互并新增模板路径工具
- 重构 SKILL.md,要求子 Agent 直接读取模板文件而非由主 Agent 摘要传送
- 新增 get-template-path.js 脚本,支持按账号和类型获取模板文件绝对路径
- 移除 capcut_assemble.js 中的关键字氛围词功能及相关依赖
|
2026-05-02 01:18:30 +08:00 |
|
|
|
0998fd6ae1
|
feat(video-pipeline): 重构视频流水线,优化成片时间线规则和状态管理
- 引入 manifest.json 作为唯一状态源,所有子 Agent 操作回写 manifest
- 重构 timebuilder 逻辑,支持四种视频适配策略(加速/裁剪/放缓/画面停顿)
- 统一 TTS 阶段输出结构,单句和多句均写入 segments[]
- 重写字幕和配音生成,基于 segments 精确时长实现音画同步
- 新增 confirm 命令支持按 id 范围确认,上传阶段分离图片和视频
- 添加中间产物写入 output/ 目录的约束,清理废弃配置参数
|
2026-05-02 00:14:40 +08:00 |
|
|
|
cafacd6327
|
根据提供的 diff 统计信息(修改了2个文件,文件名包含中文字符且路径较长,修改了38行新增、54行删除),这些文件很可能是文档或图片资源的相关修改。文件名中包含“应用图片”和“提示词”等中文关键词。
生成的中文提交信息如下:
docs: 更新应用图片和提示词相关文档
- 调整应用图片的使用说明
- 优化提示词的描述内容
|
2026-05-01 23:02:47 +08:00 |
|
|
|
b6ec208bcc
|
docs(video-from-script): 重构技能文档并优化图片生成脚本
- 简化并重组 SKILL.md 文档,清晰划分两类成片流程(幻灯片视频/AI视频)
- 移除冗余的 ASCII 图表和重复内容,使文档更具可读性
- 更新路由规则和示例,与新的分类标准保持一致
- 重构质量卡点部分,使其更简洁并明确检查标准
- 优化 phase-images.js 中的 MJ 图片生成函数,传递完整的 manifest 对象以供参考
|
2026-05-01 22:38:43 +08:00 |
|
|
|
e4723d9ce3
|
feat(video-pipeline): 添加关键字氛围词花字叠加和Oss URL回写功能
- 新增 Q17 关键字氛围词问答项,支持关闭/默认/自定义花字效果
- 在 manifest 和 account.json 中添加 keyword 和 keywordStyle 字段
- 实现关键字氛围词在画面中央的叠加逻辑,支持动画、阴影、文字效果等配置
- 在 assemble 流程中增加 `keywords` 步骤,自动读取账号配置生成花字
- 修复音频上传后未回写 OSS URL 到 manifest 的问题,避免重复上传
|
2026-05-01 15:21:59 +08:00 |
|
|
|
c878abc39b
|
feat(video-pipeline): 用 ffprobe 实际测量音视频时长并统一字段名为 script
将项目中的 `narration` 字段统一重命名为 `script`,并新增 `getAudioDurationSec` 函数通过 `ffprobe` 实际测量音频和视频文件的时长,替代 Manifest 中的估计值,提高时间线组装的准确性。同时优化字幕逻辑,仅在有 TTS 音频时调整视频速度。
|
2026-05-01 01:52:02 +08:00 |
|
|
|
7d526d2b60
|
feat(video-pipeline): 重构多阶段生成管线并集成 CosyVoice TTS
- 重写 `phase-images`:改为并发 3 张并行生成,每个 item 完成立即写入 manifest,支持 MJ task ID 恢复
- 重写 `phase-videos`:先恢复已有 task ID 再提交新任务(并发 3),支持中断恢复
- 迁移 TTS 引擎:从 Qwen-TTS HTTP 接口切换为 CosyVoice WebSocket 接口,支持音色/语气参数透传
- 精简账号系统:移除 `styles/` 目录、`taskId` 过滤和 `--id` 正则校验,`references` 改为顶层字段
- 调整 `slugify`:限制中文字符 5 个、其他 10 个,避免文件名过长
- 更新文档:`manifest-schema.md` 中 `narration` 改为完整原文案,`account-creation.md` 新增 TTS 配置项
- 配置更新:默认 TTS 模型切换为 `cosyvoice-v3.5-plus`,新增 `localAudio` 参数
|
2026-05-01 00:44:18 +08:00 |
|
|
|
86b9b7948d
|
feat(video-from-script): 重构工作流为子Agent分步执行并新增提示词模板系统
将视频制作工作流拆分为独立子步骤:分镜 → 图片提示词 → 生图 → 视频提示词 → 生视频 → 成片,每步由子Agent独立执行。引入prompts/目录统一管理提示词模板(分镜.md、图片提示词.md、视频提示词.md),通过account.json的storyboardPrompt/imageStylePrompt/videoStylePrompt字段引用。
变更内容:
- 新增confirmed机制和pipeline.js confirm命令,生图后必须人工确认才能继续
- manifest schema改用shotDesc/narration/duration/directorRef替代旧字段
- 文件命名规则从keyword改为slug(从shotDesc/narration派生)
- 删除旧的storyboard-rules.md和prompt-rules.md
- pipeline.js脚本拆分为lib/目录下的独立模块(cmd-init/cmd-confirm/cmd-validate/phase-*)
- 新增cmd-create-account支持一键创建带prompts目录的账号
- capcut_assemble支持narration字段替代text作为字幕源
- 新增.gitclaude/settings.json权限配置
|
2026-04-30 21:18:31 +08:00 |
|