概述
长话短说,最近发现微软的语音服务莫名扣费了,然后看着国内云服务动辄几千上万的语音合成服务资源包,一阵苦涩。搜了下,发现挺多基于 edge-tts 的白嫖项目,试用了下确实能用,就是和源阅读对接的体验有待提高。
因此决定自己封装一个更适合源阅读 APP 的语音合成服务,以下是介绍,有需要的直接拿。
项目介绍
本项目基于 Edge-TTS 和 FastFlyer 开发框架,可以直接私有化部署提供语音合成服务,支持和源阅读 APP 无缝对接。
体验地址(账号密码:guest / guest):
项目地址:FastTTS
框架介绍
FastFlyer 是基于 FastAPI 设计的轻量级 API 开发框架。在 FastAPI 优异特性的基础上集成了一系列开箱即用的组件,包括 Redis、MySQL、Kafka 等。采用 SDK 接入方式,内置脚手架代码生成等辅助工具,让研发人员只需要专注于业务逻辑的实现,真正开箱即用!
注:更多框架介绍请阅读:FastFlyer
快速部署
docker run --name fasttts -d -p 8080:8080 jagerzhang/fast-tts
成功启动后,访问:http://<host>:8080/speech/docs
可以看到 Swagger
工具页面。
简单鉴权
如果需要外网访问,建议开启接口鉴权:
docker run -d \
--name fasttts \
-p 8080:8080 \
-e flyer_auth_enable=1 \ # 【可选】启用 BasicAuth 鉴权
-e flyer_auth_user=guest \ # 【可选】BasicAuth 账号
-e flyer_auth_pass=guest \ # 【可选】BasicAuth 密码
jagerzhang/fast-tts
开启鉴权后,生成源阅读的配置也会自动带上鉴权头部,可以无缝对接。
对接源阅读
服务已集成和源阅读 APP 的配置生成、一键导入工具,请查看项目自述文件。
终于想起来更新一下啦
学到了,质量还是这么高,好久没更新了大佬