voicebox:免费开源本地运行的语音克隆和生成工具,将文本转换成自然流畅的语音,实现近乎完美的语音复制

发布于 更新于
176

Voicebox 是一款本地优先的语音克隆工作室,具备类似 DAW 的功能,可用于专业语音合成。您可以将其视为ElevenLabs 的本地化、免费开源替代方案-下载语音模型、克隆语音,并在您的计算机上生成语音。

与将您的语音数据锁定在订阅服务中的云服务不同,Voicebox 为您提供:

  • 完全隐私——模型和语音数据都保留在您的设备上。

  • 专业工具——多轨时间线编辑器、音频剪辑、对话混音

  • 模型灵活性——目前由 Qwen3-TTS 提供支持,即将支持 XTTS、Bark 和其他模型

  • API优先——使用桌面应用程序或将语音合成集成到您自己的项目中。

  • 原生性能——使用 Tauri(Rust)构建,而非 Electron。

  • 在 Mac 上速度超快——MLX 后端采用原生 Metal 加速,在 Apple Silicon 上推理速度提升 4-5 倍。

下载语音模型,只需几秒钟的音频即可克隆任何声音,并使用录音棚级别的编辑工具创作多声道项目。无需安装 Python,无需依赖云端,无任何限制。

软件截图

软件下载

官方网站:https://voicebox.sh/

GitHub项目地址:https://github.com/jamiepine/voicebox

0 赞
0 收藏
分享
0 讨论
反馈
0 / 600
0 条评论
热门最新
嗨,早上好!
所有的成功,都源自一个勇敢的开始