MCPcopy
hub / github.com/WEIFENG2333/VideoCaptioner

github.com/WEIFENG2333/VideoCaptioner @v1.4.2 sqlite

repository ↗ · DeepWiki ↗ · release v1.4.2 ↗
1,819 symbols 7,011 edges 184 files 1,189 documented · 65%
README

VideoCaptioner Logo

VideoCaptioner

基于大语言模型的视频字幕处理工具 — 语音识别、字幕优化、翻译、视频合成一站式处理

在线文档 · CLI 使用 · GUI 桌面版 · Claude Code Skill

安装

pip install videocaptioner          # 安装 CLI + GUI 桌面版

免费功能(必剪语音识别、必应/谷歌翻译)无需任何配置,安装即用

CLI 命令行

# 语音转录(免费,无需 API Key)
videocaptioner transcribe video.mp4 --asr bijian

# 字幕翻译(免费必应翻译)
videocaptioner subtitle input.srt --translator bing --target-language en

# 全流程:转录 → 优化 → 翻译 → 合成
videocaptioner process video.mp4 --target-language ja

# 字幕烧录到视频
videocaptioner synthesize video.mp4 -s subtitle.srt

# 下载在线视频
videocaptioner download "https://youtube.com/watch?v=xxx"

需要 LLM 功能(字幕优化、大模型翻译)时,配置 API Key:

videocaptioner config set llm.api_key <your-key>
videocaptioner config set llm.api_base https://api.openai.com/v1
videocaptioner config set llm.model gpt-4o-mini

配置优先级:命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值。运行 videocaptioner config show 查看当前配置。

所有 CLI 命令一览

命令 说明
gui 打开桌面版。也可以直接运行 videocaptioner-gui
transcribe 语音转字幕。引擎:faster-whisperwhisper-apibijian(免费)、jianying(免费)、whisper-cpp
subtitle 字幕优化/翻译。翻译服务:llmbing(免费)、google(免费)
dub 根据字幕生成配音音轨或配音视频
synthesize 字幕烧录到视频(软字幕/硬字幕)
process 全流程处理
download 下载 YouTube、B站等平台视频
config 配置管理(showsetgetpathinit

运行 videocaptioner <命令> --help 查看完整参数。完整 CLI 文档见 docs/cli.md

GUI 桌面版

pip install videocaptioner
videocaptioner-gui                  # 显式打开桌面版
videocaptioner gui                  # 等价命令
videocaptioner                      # 无参数时也会打开桌面版

其他安装方式:Windows 安装包 / macOS 一键脚本

Windows:从 Release 下载安装包

macOS

curl -fsSL https://raw.githubusercontent.com/WEIFENG2333/VideoCaptioner/master/scripts/run.sh | bash

页面预览 页面预览

LLM API 配置

LLM 仅用于字幕优化和大模型翻译,免费功能(必剪识别、必应翻译)无需配置。

支持所有 OpenAI 兼容接口的服务商:

服务商 官网
VideoCaptioner 中转站 api.videocaptioner.cn — 高并发,性价比高,支持 GPT/Claude/Gemini 等
SiliconCloud cloud.siliconflow.cn
DeepSeek platform.deepseek.com

在软件设置或 CLI 中填入 API Base URL 和 API Key 即可。详细配置教程

Claude Code Skill

本项目提供了 Claude Code Skill,让 AI 编程助手可以直接调用 VideoCaptioner 处理视频。

安装到 Claude Code:

mkdir -p ~/.claude/skills/videocaptioner
cp skills/SKILL.md ~/.claude/skills/videocaptioner/SKILL.md

然后在 Claude Code 中输入 /videocaptioner transcribe video.mp4 --asr bijian 即可使用。

工作原理

音视频输入 → 语音识别 → 字幕断句 → LLM 优化 → 翻译 → 视频合成
  • 词级时间戳 + VAD 语音活动检测,识别准确率高
  • LLM 语义理解断句,字幕阅读体验自然流畅
  • 上下文感知翻译,支持反思优化机制
  • 批量并发处理,效率高

开发

git clone https://github.com/WEIFENG2333/VideoCaptioner.git
cd VideoCaptioner
uv sync && uv run videocaptioner     # 运行 GUI
uv run videocaptioner --help          # 运行 CLI
uv run pyright                        # 类型检查
uv run pytest tests/test_cli/ -q      # 运行测试

许可证

GPL-3.0

Star History Chart

Core symbols most depended-on inside this repo

get
called by 105
videocaptioner/cli/config.py
_set
called by 59
videocaptioner/cli/main.py
setValue
called by 43
videocaptioner/ui/components/MySettingCard.py
start
called by 39
videocaptioner/cli/output.py
value
called by 37
videocaptioner/ui/components/SimpleSettingCard.py
main
called by 35
videocaptioner/ui/main.py
setup_logger
called by 33
videocaptioner/core/utils/logger.py
merge_chunks
called by 26
videocaptioner/core/asr/chunk_merger.py

Shape

Method 1,224
Function 328
Class 257
Route 10

Languages

Python100%

Modules by API surface

videocaptioner/ui/components/MyVideoWidget.py76 symbols
tests/test_asr/test_asr_data.py61 symbols
videocaptioner/ui/view/subtitle_interface.py60 symbols
tests/test_split/test_split_core.py55 symbols
videocaptioner/ui/view/subtitle_style_interface.py47 symbols
tests/test_cli/test_parser.py44 symbols
tests/test_asr/test_chunk_merger.py43 symbols
videocaptioner/core/entities.py41 symbols
videocaptioner/core/asr/asr_data.py41 symbols
videocaptioner/ui/view/transcription_interface.py39 symbols
videocaptioner/ui/components/FasterWhisperSettingWidget.py39 symbols
tests/test_tts/test_tts_core.py37 symbols

Dependencies from manifests, versioned

vitepress1.6.4 · 1×
vue3.5.13 · 1×
GPUtil1.4.0 · 1×
PyQt55.15.11 · 1×
diskcache5.6.3 · 1×
fonttools4.61.1 · 1×
json-repair0.49.0 · 1×
langdetect1.0.9 · 1×
modelscope1.32.0 · 1×
openai1.97.1 · 1×
pillow12.0.0 · 1×

For agents

$ claude mcp add VideoCaptioner \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact