docker容器安装coqui-ai tts

"language": "zh-cn"# 可选：语言代码"language": "zh-cn" ，"en""vocoder_name": "vocoder_models/en/ljspeech/hifigan_v2"# 指定声码器。"speaker_wav": "path/to/speaker.wav",# 可选：用于声音克隆的音频文件路径。"text": "你好，这是一个文本转语音的测试示例。需

banyanmars

738人浏览 · 2025-11-28 20:10:36

banyanmars · 2025-11-28 20:10:36 发布

拉取官方镜像（大小：4G+）

docker pull ghcr.io/coqui-ai/tts-cpu

首次启动时自动下载tacotron2-DDC-GST（大小：600M+）

docker run --rm -it -p 5002:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts-cpu -c "python3 TTS/server/server.py --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST"

或者离线下载tacotron2-DDC-GST到本地
docker run --rm -it -p 5002:5002 -v E:\docker\tts_models:/root/.local/share/tts --entrypoint /bin/bash ghcr.io/coqui-ai/tts-cpu -c "python3 TTS/server/server.py --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST"

调用生成音频内容
curl -X POST "http://localhost:5002/api/tts?text=hello%20world" --output E:\docker\tts-output\hello.wav

命令生成
docker run --rm -v E:\docker\tts_models:/root/.local/share/tts -v E:\docker\tts-output:/root/tts-output ghcr.io/coqui-ai/tts-cpu --text "%E4%BD%A0%E5%A5%BD" --model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" --out_path /root/tts-output/hello.wav

查看所有可用的预训练模型

docker run --rm -it -p 5003:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts-cpu -c "python3 TTS/server/server.py --list_models"

参数解释

"text": "你好，这是一个文本转语音的测试示例。" #需要转为URL encoding，JavaScript: encodeURIComponent()
"speaker_wav": "path/to/speaker.wav", # 可选：用于声音克隆的音频文件路径
"language": "zh-cn" # 可选：语言代码"language": "zh-cn" ，"en"
"model_name": "tts_models/en/ljspeech/tacotron2-DDC", # 指定模型
"vocoder_name": "vocoder_models/en/ljspeech/hifigan_v2" # 指定声码器

报错：

1、curl -X POST http://localhost:5002/api/tts -H "Content-Type: application/json" -d "{\"text\": \"hello world\"}"

会报错：
File "/root/TTS/utils/synthesizer.py", line 290, in tts
raise ValueError(
ValueError: You need to define either `text` (for sythesis) or a `reference_wav` (for voice conversion) to use the Coqui TTS API.

2、生成文件内容有重复回音：音频文件12s左右，text的内容太短或者没有加标点符号。

比如“你好。”生成没问题，“你好”生成有问题

参考：

https://blog.csdn.net/knight1287/article/details/142611894

https://github.com/coqui-ai/TTS

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git