KittenTTS 轻量级语音合成:可以在CPU上跑的TTS语音合成模型,仅25M,端侧 AI 的“嘴巴”
阿喵前言 现在虽然大模型很火,但在很多实际场景下(比如智能家居、手持翻译机),我们并不需要一个几十 GB 的巨无霸,我们需要的是一个能跑在几百块钱硬件上、响应快、还不费电的“小帮手”。以往的高质量语音合成(TTS)往往离不开云端 API 或
阿喵前言 现在虽然大模型很火,但在很多实际场景下(比如智能家居、手持翻译机),我们并不需要一个几十 GB 的巨无霸,我们需要的是一个能跑在几百块钱硬件上、响应快、还不费电的“小帮手”。以往的高质量语音合成(TTS)往往离不开云端 API 或
阿喵前言 喜欢玩拼豆(Perler Beads)的朋友肯定深有体会,最难的不是拼的过程,而是找底稿。网上的图纸要么像素不够清晰,要么颜色对不上手头的豆子,想自己画一张又太费眼睛。如果能把手机里的照片或者喜欢的动漫截图直接变成一张带网格、带色
阿喵前言 对于开发者或者喜欢折腾 Mac 的小伙伴来说,定时跑个脚本、定期备份数据库或是自动清理日志都是刚需。虽然系统自带了 crontab 和 launchd,但那黑乎乎的命令行和复杂的 XML 配置,改起来确实让人头大,一不小心写错个字
阿喵前言 说实话,阿喵之前确实看走眼了,差点带偏了大家。这次仔细研究了一下才发现,这哪里是记事本,这分明是“麦霸”们的福音啊!平时想练歌却找不到消音伴奏,或者伴奏带的歌词对不上,折腾半天都没法尽兴。 这个叫 Nightingale 的开源项
阿喵前言 很多《我的世界》(Minecraft)的玩家都有过一个梦想:在方块世界里复刻自己的家乡、学校,甚至是整个城市。以前想要实现这种规模的工程,要么靠顶级建筑团队纯手工搭建,要么得去研究极其复杂的地理信息系统(GIS)插件,门槛高得让人
阿喵前言 大家在网上冲浪时,一定见过那种用字符堆叠出来的图片或者视频,这种 ASCII 艺术风格带着一种复古的极客美感。以前想要制作这种效果,可能需要写代码或者寻找复杂的转换软件,流程非常繁琐。 最近阿喵发现了一个叫 asc11 的在线工具
阿喵前言 在电脑上翻看照片,大家最基本的需求无非就是“快”和“全”。Windows 自带的照片应用有时候反应迟钝,而 macOS 的预览功能虽然好用,但在处理某些特殊格式或大批量翻页时总觉得少了点定制感。很多老玩家一直钟情于 ImageGl
阿喵前言 大家平时肯定遇到过这种纠结时刻:中午到底吃什么?这顿饭该谁请客?或者在几个方案里犹豫不决。有时候我们缺的不是判断力,而是一个帮我们下定决心的“契机”。与其抓耳挠腮,不如把这些小事交给概率。 今天阿喵分享的这个 GachaGo,就是