|
|
005d748a4a
|
fix(config): 更新剪映草稿路径为macOS格式
|
2026-05-07 00:43:05 +08:00 |
|
|
|
ca13cf8757
|
feat(tts): 添加语音剪气口功能以去除首尾静音
- 集成 ffmpeg 实现自动检测并切除音频首尾静音段
- 新增 trimSilence 和 getAudioDuration 辅助函数
- 裁剪后若时长缩短则替换原音频文件,使片段时长更贴近真实语长
- 更新剪映草稿路径和 capcut-mate 目录配置
|
2026-05-07 00:42:47 +08:00 |
|
lc
|
6eec0e8889
|
feat(skills): 完善视频生产 pipeline 及新增健身跟练账号
- SKILL.md: 新增工作流阶段定义、质量卡点、分镜规则
- manifest-schema.md: 补充完整字段规范及类型定义
- phase-tts.js: 优化 TTS 合成长逻辑,添加进度追踪
- capcut-tracks.js: 扩展轨道构建能力,支持更多元素类型
- capcut-timeline.js: 改进时间线生成,支持淡入淡出
- capcut_assemble.js: 新增 assemble 阶段完整实现
- cmd-init.js: 完善 init 命令逻辑
- qwen-tts.js: 调整超时配置
- accounts/禁忌帝王学: 更新拆分/图像/台词提示词
- accounts/健身跟练: 新增账号含 account.json 及全套提示词模板
- 新增 workflow-issues-20260501.md 参考文档
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
|
2026-05-06 22:53:37 +08:00 |
|
|
|
35488beef2
|
feat(skills): 集成 GPT Image 图片生成和编辑能力
- 新增 gpt-image-generator.js 脚本,支持文生图、图生图/重绘、批量生成
- 更新 pipeline 和 phase-images 支持 GPT Image 模型
- 更新技能文档,添加 GPT Image 使用说明和 API 特点
- 新增配置文件中的 GPT Image API 参数
|
2026-05-05 23:49:30 +08:00 |
|
|
|
0998fd6ae1
|
feat(video-pipeline): 重构视频流水线,优化成片时间线规则和状态管理
- 引入 manifest.json 作为唯一状态源,所有子 Agent 操作回写 manifest
- 重构 timebuilder 逻辑,支持四种视频适配策略(加速/裁剪/放缓/画面停顿)
- 统一 TTS 阶段输出结构,单句和多句均写入 segments[]
- 重写字幕和配音生成,基于 segments 精确时长实现音画同步
- 新增 confirm 命令支持按 id 范围确认,上传阶段分离图片和视频
- 添加中间产物写入 output/ 目录的约束,清理废弃配置参数
|
2026-05-02 00:14:40 +08:00 |
|
lc
|
d800441e86
|
chore: 迁移配置到 macOS 并清理废弃参考素材
- 更新 config.json 路径从 Windows 切换到 macOS
- phase-videos.js 添加 mode: 'pro' 参数
- 删除禁忌帝王学账号下废弃的 grunge/manga/popart 参考图
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
|
2026-05-01 22:49:49 +08:00 |
|
|
|
7d526d2b60
|
feat(video-pipeline): 重构多阶段生成管线并集成 CosyVoice TTS
- 重写 `phase-images`:改为并发 3 张并行生成,每个 item 完成立即写入 manifest,支持 MJ task ID 恢复
- 重写 `phase-videos`:先恢复已有 task ID 再提交新任务(并发 3),支持中断恢复
- 迁移 TTS 引擎:从 Qwen-TTS HTTP 接口切换为 CosyVoice WebSocket 接口,支持音色/语气参数透传
- 精简账号系统:移除 `styles/` 目录、`taskId` 过滤和 `--id` 正则校验,`references` 改为顶层字段
- 调整 `slugify`:限制中文字符 5 个、其他 10 个,避免文件名过长
- 更新文档:`manifest-schema.md` 中 `narration` 改为完整原文案,`account-creation.md` 新增 TTS 配置项
- 配置更新:默认 TTS 模型切换为 `cosyvoice-v3.5-plus`,新增 `localAudio` 参数
|
2026-05-01 00:44:18 +08:00 |
|
|
|
5619d753cc
|
feat(video-from-script): 升级可灵视频生成使用官方 API 并添加失败重试机制
- 使用 AK/SK → JWT (HMAC-SHA256) 鉴权替代旧版 API Key
- 支持多种凭证来源:~/.config/kling/.credentials 或 config.json
- 更新 API 端点至官方规范 (v1/videos/image2video)
- 添加 `--retry-failed` 参数支持失败 item 状态重置和重试
- 更新 manifest 文档添加状态机和失败处理说明
- 调整模型名称和参数格式以匹配新 API
|
2026-04-29 21:56:47 +08:00 |
|
|
|
0b3ab3a2aa
|
优化
|
2026-04-29 21:26:42 +08:00 |
|
|
|
1333a2c751
|
功能
|
2026-04-29 21:05:44 +08:00 |
|