音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。
音谷-AI多角色多情绪配音平台是一款基于AGPL-3.0协议开源的AI配音工具。该平台采用Electron+Vue+FastAPI技术栈,支持小说、剧本等内容的多角色多情绪语音合成,提供文本导入、角色管理、情绪绑定、音频编辑等功能。技术核心采用Index-TTS-2.0服务,支持本地部署或云端调用。二次开发需遵守署名规范和非商用限制。项目包含完整的前后端架构,开发者可通过GitHub获取源码,按照
简介说明
音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。
定位:为小说、剧本、视频等内容提供多角色、多情绪的 AI 语音合成与配音服务
主要功能:
- 小说 / 剧本文本导入
- 多角色角色库管理
- 情绪音色选择与绑定
- 台词自动拆分与配音生成
- 批量任务管理与导出
- 支持自定义 LLM 接口选择与调用
- 基于Index-TTS-2.0的多情绪TTS服务
- 支持精准的音频编辑功能,可以自定义删除音频片段或者添加静音片段
- 支持自定义提示词,适配个性化拆分需求
🛠 技术栈
- 前端:Electron + Vue + Element Plus
- 后端:FastAPI / Python
- AI 接口:兼容 OpenAI API 协议的大模型
- TTS 服务:IndexTTs-2 + Cloud Native Build 平台(免费 H20 显卡支持)/ 本地部署整合包
二次开发说明
本软件依据 AGPL-3.0 开源许可协议发布。基于本项目进行二次开发时,开发者须遵守以下规范:
1. 署名要求
必须在衍生软件的用户界面及代码文档中清晰标注:
"本软件基于开源项目《音谷》二次开发"
并附上原项目仓库链接。
2. 商业使用限制
未获得书面商业授权前,任何基于本项目的衍生作品不得用于商业用途或提供商业服务。
🚀 快速开始
1️⃣ 克隆项目
git clone https://github.com/xcLee001/SonicVale.git cd SonicVale
2️⃣ 启动后端
首先,需要下载ffmpeg.exe到app/core/ffmpeg/ffmpeg.exe
可以去官网ffmpeg 。也可以使用此镜像
然后复制到app/core/ffmpeg/目录下
安装依赖和启动服务
cd SonicVale pip install -r requirements.txt uvicorn app.main:app --reload --port 8200
项目结构:
app/ ├── core/ # 全局配置、tts引擎、llm引擎、ffmpeg封装、字幕生成、websocket、异步队列 ├── db/ # 数据库连接和Base ├── models/ # ORM模型 ├── dto/ # 数据传输对象(请求/响应验证) ├── entity/ # 实体类(结合 ORM 与业务层) ├── repositories/ # 数据库封装 ├── services/ # 核心业务逻辑 ├── routers/ # FastAPI路由接口 └── main.py # FastAPI启动入口
3️⃣ 启动前端
cd sonicvale-front npm install # 安装依赖 npm run start # 启动前端包括electron
图片预览













下载地址
源码+安装包
https://github.com/xcLee001/SonicVale
https://pan.baidu.com/s/1VUvGn6rh-NwNZsnxmWSYXw?pwd=a9dx 提取码: a9dx
点击链接或复制整段内容,打开「夸克APP」即可获取。
/~80413Y1Tuf~:/
链接:https://pan.quark.cn/s/b4289b4f8b72
更多推荐
所有评论(0)