一个将日语视频翻译为中文字幕的工具,支持 MP3 / WAV / Flac 等音频格式,以及 MP4 / MKV / AVI 等视频格式,并可导出 SRT / VTT / LRC 等字幕格式,支持 CUDA 11.8/12.2/12.8,充分利用 NVIDIA 显卡性能,支持 Modal 云端 GPU 推理,另外还可批量处理和自定义转录参数
项目截图

功能特性
-
🎯 高精度日文转中文翻译: 基于5000小时音频数据训练的”海南鸡v2″日文转中文优化模型
-
🚀 GPU加速: 支持 NVIDIA CUDA 11.8/12.2/12.8 及 AMD ROCm/HIP(RDNA1–RDNA4)
-
☁️ 云端推理: 支持 Modal 云端 GPU 推理,无本地显卡也能使用
-
📝 多格式输出: 支持SRT、VTT、LRC等多种字幕格式
-
🎬 音视频支持: 支持常见音频(mp3/wav/flac等)和视频格式(mp4/mkv/avi等)
-
💾 智能缓存: 自动跳过已处理文件,提高批量处理效率
-
🔧 灵活配置: 可自定义转录参数,满足不同场景需求
版本说明
基础版 (Base Package) – 约 2.2GB
-
✅ 所有 GPU 依赖项
-
✅ 音声优化 VAD(语音活动检测)模型
-
❌ 不含 Whisper 模型(需自行下载)
海南鸡版 (ChickenRice Edition) – 约 4.4GB
-
✅ 所有 GPU 依赖项
-
✅ 音声优化 VAD(语音活动检测)模型
-
✅ “海南鸡v2 5000小时” 日文转中文优化模型(开箱即用)
详细文档
项目链接
github:https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

