docker 一键部署Funasr实时语音转换
1.前提是已经安装了docker ,按照上述步骤即可成功部署funasr。
·
mkdir -p ./funasr-runtime-resources/models #创建宿主机模型目录
sudo chown -R root:root ./funasr-runtime-resources/models # 递归设置目录及所有子文件的所有者
sudo chmod -R 755 ./funasr-runtime-resources/models # 递归设置目录权限为 755
sudo docker run -d -p 10096:10095 --privileged=true \
--name funasr-server \
-v $PWD/funasr-runtime-resources/models:/workspace/models \
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.13 \
bash -c "cd /workspace/FunASR/runtime && \
nohup bash run_server_2pass.sh \
--download-model-dir /workspace/models \
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
--model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx \
--online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx \
--punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
--itn-dir thuduj12/fst_itn_zh \
--hotword /workspace/models/hotwords.txt \
--certfile 0 > /workspace/models/log.txt 2>&1 & \
tail -f /workspace/models/log.txt"
1.前提是已经安装了docker ,按照上述步骤即可成功部署funasr
2.测试效果:
# 获取压缩包,里面有python java 以及其他测试方式
wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/sample/funasr_samples.tar.gz
# 以Python语言客户端为例
tar xf funasr_samples.tar.gz && cd samples/python
# 安装音频转换工具
sudo apt update && sudo apt install -y ffmpeg
# .m4a 转标准 WAV:核心是指定编码为 pcm_s16le(16bit),并调整采样率和声道
# 可以手机录制一段音频用ffmpeg转换成模型可以识别的格式进行测试
ffmpeg -y -i phone_recording.m4a \
-ac 1 \ # 强制转为单声道
-ar 16000 \ # 强制转为 16k 采样率
-sample_fmt s16 \# 强制转为 16bit 位深
-acodec pcm_s16le \ # 输出为 PCM 编码(WAV 标准格式)
my_voice_test.wav # 输出的标准 WAV 文件名
#安装python工具后执行下面命令进行测试
python3 funasr_wss_client.py \
--host "" \ # 服务端 IP
--port 10096 \ # 服务端 WebSocket 端口
--mode 2pass \ # 2pass 模式(和服务端一致)
--ssl 0 \ # 关闭 SSL(服务端 --certfile 0 对应)
--audio_in my_voice_test.wav # 你转换后的语音 WAV
更多推荐
所有评论(0)