脚本编程

FastTTS:支持私有化部署和源阅读无缝对接的语音合成服务

Jager · 1月16日 · 2025年 · · 289次已读

概述

长话短说,最近发现微软的语音服务莫名扣费了,然后看着国内云服务动辄几千上万的语音合成服务资源包,一阵苦涩。搜了下,发现挺多基于 edge-tts 的白嫖项目,试用了下确实能用,就是和源阅读对接的体验有待提高。

因此决定自己封装一个更适合源阅读 APP 的语音合成服务,以下是介绍,有需要的直接拿。

项目介绍

本项目基于 Edge-TTS 和 FastFlyer 开发框架,可以直接私有化部署提供语音合成服务,支持和源阅读 APP 无缝对接。

体验地址(账号密码:guest / guest):

项目地址:FastTTS

框架介绍

FastFlyer 是基于 FastAPI 设计的轻量级 API 开发框架。在 FastAPI 优异特性的基础上集成了一系列开箱即用的组件,包括 Redis、MySQL、Kafka 等。采用 SDK 接入方式,内置脚手架代码生成等辅助工具,让研发人员只需要专注于业务逻辑的实现,真正开箱即用!

注:更多框架介绍请阅读:FastFlyer

快速部署

docker run --name fasttts -d -p 8080:8080 jagerzhang/fast-tts 

成功启动后,访问:http://<host>:8080/speech/docs 可以看到 Swagger 工具页面。

简单鉴权

如果需要外网访问,建议开启接口鉴权:

docker run -d \
    --name fasttts \
    -p 8080:8080 \
    -e flyer_auth_enable=1 \    # 【可选】启用 BasicAuth 鉴权
    -e flyer_auth_user=guest \  # 【可选】BasicAuth 账号 
    -e flyer_auth_pass=guest \  # 【可选】BasicAuth 密码
    jagerzhang/fast-tts 

开启鉴权后,生成源阅读的配置也会自动带上鉴权头部,可以无缝对接。

对接源阅读

服务已集成和源阅读 APP 的配置生成、一键导入工具,请查看项目自述文件

2 条回应
  1. 何先生 2025-2-7 · 19:24

    终于想起来更新一下啦

  2. 韩涛博客 2025-3-16 · 17:28

    学到了,质量还是这么高,好久没更新了大佬