在本地部署LLM模型并接入ASR模型实现外部语音接口与LLM对话聊天

这是一个全程运行在你本地的 AI 对话系统。基于阿里巴巴 Qwen3 系列模型深度构建。语音识别（ASR）：采用 Qwen3-ASR 1.7B，精准识别外部输入。智能对话（LLM）：通过 Ollama 驱动 Qwen3 4B，本地大脑快速响应。语音合成（TTS）：结合 Qwen3-TTS，赋予 AI 自然的人类声线。系统底层由 Rust 语言编写，确保了音频流采集的超低延迟。无论是免驱麦克风还是内

ldlno

430人浏览 · 2026-03-07 21:10:50

ldlno · 2026-03-07 21:10:50 发布

在本地部署LLM模型并接入ASR模型实现外部语音接口与LLM对话聊天

一、下载OLLAMA

请添加图片描述

或者直接用我网盘里面的链接：

ollama：v0.17.4

https://pan.baidu.com/s/1-F1q6YK7voii3pw84LPuRQ?pwd=xy6x

1.1 下载安装qwen模型

在powershell运行：

ollama run qwen3:4b

请添加图片描述

安装完成后输入一句话测试一下：

请添加图片描述

二、配置安装Qwen3-ASR模型

参考文档：

https://modelscope.cn/models/Qwen/Qwen3-ASR-1.7B

百度网盘下载到本地模型权重：

https://pan.baidu.com/s/1wKI6Bm74LSyXX-DhSXeG5Q?pwd=rnr3

2.1 配置qwen3-asr模型运行环境

配置Qwen3 ASR 环境

conda create -n qwen3-asr python=3.12 -y

conda activate qwen3-asr

这边选择使用vLLM 推理以获得更快的推理速度和流式支持

pip install -U qwen-asr[vllm]

安装完后可以尝试一下是否可以运行ASR模型：

python ./test.py

三、配置安装Qwen3-TTS模型

参考文档：https://modelscope.cn/studios/Qwen/Qwen3-TTS

模型网盘链接：https://pan.baidu.com/s/1-WBnqH1Ycw2pPeE5NTsXKQ?pwd=w6c5

本项目使用到的模型为：Qwen3-TTS-12Hz-0.6B-CustomVoice

3.1 配置运行环境

conda activate qwen3-asr
pip install -U qwen-tts

3.2 测试TTS模型

测试模型是否可以正常加载并运行

可以直接运行：

python test_tts.py

3.3 报错 Sox not found

如果报错 Sox not found 则需要下载安装一下，下面提供百度网盘下载链接：

通过网盘分享的文件：sox-14.4.2-win32.exe
链接: https://pan.baidu.com/s/1d_M_ozJ45Kl9D-76EnNlYQ?pwd=ubab 提取码: ubab
安装完成以后需要配置一下环境变量：

在系统环境变量 Path中添加刚刚 Sox的安装路径：

请添加图片描述

检查 sox是否成功需要在powershell 输入 sox —version 检查
请添加图片描述

四、配置安装Rust编译环境

从：https://rust-lang.org/tools/install/ 网站下载rust-init 并安装编译环境

安装完成后输入 cargo -h rustc -h 检查是否可以正常使用
请添加图片描述

请添加图片描述

五、外部设备

买一块免驱麦克风：
请添加图片描述

接入外部音频

六、git clone 源码编译运行

GitHub - Xldln/llm_asr_chat_base_qwen: The workflow involves utilizing Qwen3’s ASR for speech-to-text conversion of external audio inputs. The resulting text is then integrated into an Ollama-managed Qwen3 model for chat output.

cd lam_qwen3

## 先启动fastapi 运行 TTS 推理服务和 ASR 推理服务

python app/main.py

##等待启动成功 

## 另外开个终端 运行 rust项目

cargo run 

## 以上命令可以直接编译运行 rust项目

成功如下：

FastApi:

请添加图片描述

Rust：
请添加图片描述

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git