搜索

voicebox：免费开源本地运行的语音克隆和生成工具，将文本转换成自然流畅的语音，实现近乎完美的语音复制

发布于 2/24更新于 2/27

903

Voicebox 是一款本地优先的语音克隆工作室，具备类似 DAW 的功能，可用于专业语音合成。您可以将其视为ElevenLabs 的本地化、免费开源替代方案-下载语音模型、克隆语音，并在您的计算机上生成语音。

与将您的语音数据锁定在订阅服务中的云服务不同，Voicebox 为您提供：

完全隐私——模型和语音数据都保留在您的设备上。
专业工具——多轨时间线编辑器、音频剪辑、对话混音
模型灵活性——目前由 Qwen3-TTS 提供支持，即将支持 XTTS、Bark 和其他模型
API优先——使用桌面应用程序或将语音合成集成到您自己的项目中。
原生性能——使用 Tauri（Rust）构建，而非 Electron。
在 Mac 上速度超快——MLX 后端采用原生 Metal 加速，在 Apple Silicon 上推理速度提升 4-5 倍。

下载语音模型，只需几秒钟的音频即可克隆任何声音，并使用录音棚级别的编辑工具创作多声道项目。无需安装 Python，无需依赖云端，无任何限制。

软件截图

软件下载

官方网站：https://voicebox.sh/

GitHub项目地址：https://github.com/jamiepine/voicebox

0 讨论

热门最新

总结

暂无总结

0 / 600