
按住 CapsLock 说话,松开就上屏。就这么简单。
CapsWriter-Offline 是一个专为 Windows 打造的完全离线语音输入工具。
CapsLock键 或 鼠标侧键X2 说话,松开即输入,超低延迟,默认去除末尾逗句号。支持对讲机模式和单击录音模式。.srt)、文本 (.txt)、时间戳 (.json) 统统都有。hot.txt 记下偏僻词,通过音素模糊匹配,相似度大于阈值则强制替换。hot-rule.txt 用正则或简单等号规则,精准强制替换。CapsWriter-Offline 的精髓在于:完全离线(不受网络限制)、响应极快、高准确率 且 高度自定义。我追求的是一种「如臂使指」的流畅感,让它成为一个专属的一体化输入利器。无需安装,一个U盘就能带走,随插随用,保密电脑也能用。
以下为支持的模型:
| 引擎名 | 准确性 | 速度 | 格式 | 显卡加速 |
|---|---|---|---|---|
| Paraformer | ★★★☆☆ | ★★★★★ | ONNX | ❌ |
| SenseVoice-Small | ★★★☆☆ | ★★★★★ | ONNX | ✅ |
| Fun-ASR-Nano | ★★★★☆ | ★★★★☆ | ONNX + GGUF | ✅ |
| Qwen3-ASR | ★★★★★ | ★★★☆☆ | ONNX + GGUF | ✅ |
性能参考(20s 音频转录延迟):
| 模型 | CPU U9-285H | GPU RTX5050 |
|---|---|---|
| Paraformer | 0.6s | - |
| SenseVoice-Small | 0.6s | 0.15s |
| Fun-ASR-Nano | 2.0s | 0.5s |
| Qwen3-ASR-1.7B | 4.0s | 1.0s |
详细功能说明请参考 docs/ 目录:
- 环境依赖安装说明 — VC++ 运行库、FFmpeg 安装
- 热词功能如何使用 — 热词替换、规则替换、自定义短语
- 角色功能如何使用 — LLM 角色配置、输出模式、创建新角色
- 识别语言如何配置 — 各引擎语言支持范围与配置方法
- 文件转录功能如何使用 — 拖拽转字幕、时间戳对齐
- 显卡加速的若干问题 — DirectML、Vulkan 加速配置
- 模型下载的若干问题 — 引擎选择、模型下载、目录结构
- 常见问题 — FAQ
- 更新日志
目前仅能保证在 Windows 10/11 (64位) 下完美运行。
keyboard 库已放弃支持 MacOS,且系统限制极多,暂时无法支持。LazyTyper 和 闪电说 也是很优秀的作品,都有离线引擎,都支持 Windows Linux 与 MacOS,并都有漂亮的图形化页面,推荐使用。
CapsWriter 的特别之处在于追求:
models 文件夹中对应模型的文件夹里。start_server.exe,它会自动最小化到托盘菜单。start_client.exe,它会自动最小化到托盘菜单。CapsLock键 或 鼠标侧键X2 就可以说话了!所有的设置都在根目录的 config_server.py 和 config_client.py 里,可直接编辑。
Q: 为什么按了没反应?
A: 请确认 start_client.exe 的黑窗口还在运行。若想在管理员权限运行的程序中输入,也需以管理员权限运行客户端。
Q: 为什么识别结果没字?
A: 到 年/月/assets 文件夹中检查录音文件,看是不是没有录到音;听听录音效果,是不是麦克风太差,建议使用桌面 USB 麦克风;检查麦克风权限。
Q: 想要隐藏黑窗口?
A: 点击托盘菜单即可隐藏黑窗口。
Q: 如何开机启动?
A: Win+R 输入 shell:startup 打开启动文件夹,将服务端、客户端的快捷方式放进去即可。
更多问题请参阅 docs/常见问题.md。
| 项目名称 | 说明 | 体验地址 |
|---|---|---|
| IME_Indicator | Windows 输入法中英状态指示器 | 下载即用 |
| Rust-Tray | 将控制台最小化到托盘图标的工具 | 下载即用 |
| Gallery-Viewer | 网页端图库查看器,纯 HTML 实现 | 点击即用 |
| 全景图片查看器 | 单个网页实现全景照片、视频查看 | 点击即用 |
| 图标生成器 | 使用 Font-Awesome 生成网站 Icon | 点击即用 |
| 五笔编码反查 | 86 五笔编码在线反查 | 点击即用 |
| 快捷键映射图 | 可视化、交互式的快捷键映射图 (中文版) | 点击即用 |
本项目基于以下优秀的开源项目:
感谢 Google Antigravity、Anthropic Claude、GLM、DeepSeek,如果不是这些编程助手,许多功能(例如基于音素的热词检索算法)我是无力实现的。
特别感谢那些慷慨解囊的捐助者,你们的捐助让我用在了购买这些优质的 AI 编程助手服务,并最终将这些成果反馈到了软件的更新里。
如果觉得好用,欢迎点个 Star 或者打赏支持:
$ claude mcp add CapsWriter-Offline \
-- python -m otcore.mcp_server <graph>