ZiMu（自动识别字幕）

一个本地 Python CLI 项目：对视频/音频文件进行自动语音识别，生成字幕文件（默认 .srt），并可选将字幕软封装到视频或烧录到画面上。

依赖

Python 3.9+
ffmpeg（必须安装并加入 PATH）
ASR：默认使用 faster-whisper

安装

建议使用虚拟环境：

python -m venv .venv
.\.venv\Scripts\activate
python -m pip install -U pip
pip install -e .

快速开始

只生成字幕（推荐先用这个）：

zimu "input.mp4"

指定输出目录、模型、语言（不填语言则自动检测）：

zimu "input.mp4" --out-dir outputs --model small --language zh

生成 VTT：

zimu "input.mp4" --format vtt

把字幕软封装进新视频（不压制画面，字幕可开关）：

zimu "input.mp4" --mux --out "output.mkv"

把字幕烧录进画面（会重新编码视频）：

zimu "input.mp4" --burn --out "output.mp4"

WAV 转 MP4

将纯音频 .wav 转为包含视频轨的 .mp4（视频轨默认黑屏；音频 AAC 编码）：

python -m zimu.wav_to_mp4 input.wav
python -m zimu.wav_to_mp4 input.wav -o output.mp4
python -m zimu.wav_to_mp4 input.wav -o output.mp4 -b 192k
python -m zimu.wav_to_mp4 input.wav -o output.mp4 --size 1920x1080 --fps 30

常见问题

找不到 ffmpeg

请安装 ffmpeg 并确保在命令行能运行：

ffmpeg -version

模型下载慢/失败

首次运行会下载模型（体积较大）。你可以先用 --model tiny 试跑确认流程。

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
zimu		zimu
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ZiMu（自动识别字幕）

依赖

安装

快速开始

WAV 转 MP4

常见问题

找不到 ffmpeg

模型下载慢/失败

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ZiMu（自动识别字幕）

依赖

安装

快速开始

WAV 转 MP4

常见问题

找不到 ffmpeg

模型下载慢/失败

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages