Voicebox 是一款本地优先的语音克隆工作室,具备类似 DAW 的功能,可用于专业语音合成。您可以将其视为ElevenLabs 的本地化、免费开源替代方案-下载语音模型、克隆语音,并在您的计算机上生成语音。
与将您的语音数据锁定在订阅服务中的云服务不同,Voicebox 为您提供:
-
完全隐私——模型和语音数据都保留在您的设备上。
-
专业工具——多轨时间线编辑器、音频剪辑、对话混音
-
模型灵活性——目前由 Qwen3-TTS 提供支持,即将支持 XTTS、Bark 和其他模型
-
API优先——使用桌面应用程序或将语音合成集成到您自己的项目中。
-
原生性能——使用 Tauri(Rust)构建,而非 Electron。
-
在 Mac 上速度超快——MLX 后端采用原生 Metal 加速,在 Apple Silicon 上推理速度提升 4-5 倍。
下载语音模型,只需几秒钟的音频即可克隆任何声音,并使用录音棚级别的编辑工具创作多声道项目。无需安装 Python,无需依赖云端,无任何限制。
软件截图

软件下载
官方网站:https://voicebox.sh/
GitHub项目地址:https://github.com/jamiepine/voicebox

