docker 一键部署Funasr实时语音转换

1.前提是已经安装了docker ,按照上述步骤即可成功部署funasr。

小白编代码

311人浏览 · 2025-10-22 10:13:47

小白编代码 · 2025-10-22 10:13:47 发布

mkdir -p ./funasr-runtime-resources/models #创建宿主机模型目录

sudo chown -R root:root ./funasr-runtime-resources/models # 递归设置目录及所有子文件的所有者

sudo chmod -R 755 ./funasr-runtime-resources/models # 递归设置目录权限为 755

sudo docker run -d -p 10096:10095 --privileged=true \
  --name funasr-server \
  -v $PWD/funasr-runtime-resources/models:/workspace/models \
  registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.13 \
  bash -c "cd /workspace/FunASR/runtime && \
           nohup bash run_server_2pass.sh \
             --download-model-dir /workspace/models \
             --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
             --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx \
             --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx \
             --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \
             --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
             --itn-dir thuduj12/fst_itn_zh \
             --hotword /workspace/models/hotwords.txt \
             --certfile 0 > /workspace/models/log.txt 2>&1 & \
           tail -f /workspace/models/log.txt"

1.前提是已经安装了docker ,按照上述步骤即可成功部署funasr

2.测试效果：

# 获取压缩包，里面有python java 以及其他测试方式
wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/sample/funasr_samples.tar.gz

# 以Python语言客户端为例
tar xf funasr_samples.tar.gz && cd samples/python

# 安装音频转换工具
sudo apt update && sudo apt install -y ffmpeg

# .m4a 转标准 WAV：核心是指定编码为 pcm_s16le（16bit），并调整采样率和声道
# 可以手机录制一段音频用ffmpeg转换成模型可以识别的格式进行测试
ffmpeg -y -i phone_recording.m4a \
  -ac 1 \          # 强制转为单声道
  -ar 16000 \      # 强制转为 16k 采样率
  -sample_fmt s16 \# 强制转为 16bit 位深
  -acodec pcm_s16le \  # 输出为 PCM 编码（WAV 标准格式）
  my_voice_test.wav     # 输出的标准 WAV 文件名

#安装python工具后执行下面命令进行测试
python3 funasr_wss_client.py \
  --host "" \  # 服务端 IP
  --port 10096 \           # 服务端 WebSocket 端口
  --mode 2pass \           # 2pass 模式（和服务端一致）
  --ssl 0 \                # 关闭 SSL（服务端 --certfile 0 对应）
  --audio_in my_voice_test.wav  # 你转换后的语音 WAV

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git