阿喵前言
现在的 TTS 引擎虽然多,但大多依赖云端算力,不仅有隐私泄露的风险,在断网或者网络波动时体验也很糟糕。更重要的是,云端音色的“机械感”依然存在,很难找到完全符合个人喜好的声音。
CloneTTS 解决了这两个痛点:它把复杂的语音克隆和推理过程全部压进了安卓手机本地。你只需要提供几秒钟的目标人声样本,它就能生成一个专属的离线音色。对于喜欢用手机听书、看长文档的朋友来说,这不仅是节省流量,更是实现了“音色自由”。
软件介绍
CloneTTS 是一款轻量级的安卓原生 TTS 引擎,支持离线发音人提取与系统级全局调用。它利用本地模型进行语音合成,不产生任何联网数据。软件通过注册为安卓系统的 TTS 服务,可以接管所有支持系统语音输出的 App,如《阅读》、Moon+ 等,提供稳定、私密的朗读体验。
功能特色
| 功能模块 | 具体表现 | 实用价值 |
| 离线音色克隆 | 仅需 1~3 秒录音样本即可生成专属音色 | 隐私安全,不依赖云端,永久免费。 |
| 系统级 TTS 集成 | 注册为 Android 原生文字转语音服务 | 兼容性极强,全局接管第三方阅读器的朗读。 |
| 本地 HTTP API | 内置服务器支持 GET/POST 请求 | 支持在《阅读(Legado)》中实现分角色听书。 |
| 发音纠错规则 | 支持正则表达式与纯文本替换 | 强制修正多音字、特定术语或人名的发音。 |
| 性能透明化 | 实时显示推理速率(RTF)和算力耗时 | 方便根据手机性能调节合成步数(Steps)。 |
使用说明
1. 基础配置(保活必做)
由于本地推理任务较重,安卓系统容易为了省电强杀后台进程。
- 电池优化:进入系统设置,将 CloneTTS 设为“无限制”或“允许后台行为”。
- 任务加锁:在多任务界面给 App 加锁,防止一键清理导致听书中断。
2. 音色克隆流程
- 添加音色:在“音色管理”中选择录音或上传 1~3 秒的人声。
- 文本匹配:填写的参考文本必须与音频内容完全一致,否则合成音质会大幅下降。
- 精度调节:推荐
num_steps设为 2 以保证速度;追求更高音质可调至 4,但会增加耗时。
3. 接管系统朗读
- 在手机设置中搜索“文字转语音输出”,将默认引擎切换为 CloneTTS。
- 随后在任何阅读器点击“开始朗读”,系统将自动调用 CloneTTS 的当前默认音色。
软件下载
GitHub 源码:https://github.com/sipeter/CloneTTS
下载地址:前往 GitHub 的 Releases 页面下载最新版 .apk 文件。
