Qwen3-ASR-1.7B在Linux环境下的高效部署指南

运营的小事

186人浏览 · 2026-02-09 00:26:26

运营的小事 · 2026-02-09 00:26:26 发布

Qwen3-ASR-1.7B在Linux环境下的高效部署指南

最近阿里开源了Qwen3-ASR系列语音识别模型，其中1.7B版本在多个评测中都表现抢眼，支持52种语言和方言，还能识别带背景音乐的歌曲。很多朋友想在自己的Linux服务器上部署试试，但看到一堆依赖和配置就有点头疼。

其实部署起来没想象中那么复杂，跟着步骤走，半小时内就能搞定。今天我就手把手带你走一遍完整的部署流程，从环境准备到性能测试，还会分享一些GPU资源优化的实用技巧。

1. 环境准备：打好基础很重要

在开始之前，得先确认你的Linux环境是否满足基本要求。Qwen3-ASR-1.7B对硬件和软件都有一些基本要求，提前检查能避免后续很多麻烦。

1.1 系统要求检查

首先打开终端，检查一下你的系统信息：

# 查看Linux发行版和版本
cat /etc/os-release

# 查看Python版本（需要3.8以上）
python3 --version

# 查看CUDA版本（如果需要GPU加速）
nvcc --version  # 或者 nvidia-smi

我建议的系统配置是这样的：

操作系统：Ubuntu 20.04或22.04，CentOS 7/8也可以
Python版本：3.8到3.11之间，太新或太旧都可能有问题
CUDA版本：11.8或12.1（如果要用GPU）
内存：至少8GB，建议16GB以上
磁盘空间：模型文件大概3-4GB，加上依赖和缓存，准备10GB比较稳妥

如果你用的是云服务器，比如阿里云、腾讯云的GPU实例，这些环境通常都已经预装了CUDA，省事不少。

1.2 创建虚拟环境

我强烈建议使用虚拟环境，这样不同项目的依赖不会互相干扰。用venv或者conda都可以，这里我用venv演示：

# 创建虚拟环境目录
python3 -m venv qwen_asr_env

# 激活虚拟环境
source qwen_asr_env/bin/activate

# 激活后命令行前面会出现 (qwen_asr_env) 提示

激活后，所有后续的pip安装都会在这个环境里进行，不会影响系统全局的Python包。

2. 依赖安装：一步步来别着急

依赖安装是部署过程中最容易出问题的环节，特别是涉及到PyTorch和CUDA的版本匹配。我按照安装顺序给你梳理一下。

2.1 安装PyTorch

PyTorch是基础，版本一定要选对。去PyTorch官网看看最新推荐，但根据我的经验，下面这个组合比较稳定：

# 对于CUDA 11.8
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# 对于CUDA 12.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 如果只用CPU（不推荐，速度会很慢）
pip install torch torchvision torchaudio

安装完可以验证一下：

import torch
print(f"PyTorch版本: {torch.__version__}")
print(f"CUDA是否可用: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU设备: {torch.cuda.get_device_name(0)}")

2.2 安装Qwen3-ASR核心包

接下来安装Qwen3-ASR的Python包。官方提供了两种安装方式，我推荐用第一种，比较省事：

# 方式一：安装基础版本（包含核心功能）
pip install qwen-asr

# 方式二：如果要使用vLLM加速（后面会讲到）
pip install qwen-asr[vllm]

这里有个小技巧：如果你网络不太好，下载模型很慢，可以设置一下环境变量，让下载走国内镜像：

# 设置ModelScope的缓存路径（国内镜像加速）
export MODELSCOPE_CACHE=/path/to/your/cache
echo 'export MODELSCOPE_CACHE=/path/to/your/cache' >> ~/.bashrc

# 也可以设置HuggingFace的缓存
export HF_HUB_CACHE=/path/to/another/cache

2.3 安装其他必要依赖

还有一些工具包虽然不是必须的，但用起来会很方便：

# 音频处理相关
pip install soundfile librosa

# 如果要做流式处理
pip install pydub

# 开发调试工具
pip install ipython jupyter

到这里，基础依赖就装得差不多了。如果一切顺利，你应该能看到所有包都成功安装。

3. 模型下载与加载

依赖装好了，接下来就是把模型下载到本地。Qwen3-ASR-1.7B模型文件大概3GB左右，下载需要一点时间。

3.1 下载模型

官方提供了好几种下载方式，我推荐用ModelScope，国内下载速度比较快：

from modelscope import snapshot_download

# 下载模型到本地缓存
model_dir = snapshot_download('Qwen/Qwen3-ASR-1.7B')
print(f"模型下载到: {model_dir}")

如果你更喜欢用命令行，也可以这样：

# 使用modelscope-cli下载
pip install modelscope
modelscope download Qwen/Qwen3-ASR-1.7B

下载过程中，你可以看到进度条。第一次下载会慢一些，因为要下载完整的模型文件。下载完成后，模型会缓存在本地，下次就不用重新下载了。

3.2 加载模型

模型下载好了，现在来加载它。根据你的硬件情况，选择不同的加载方式：

import torch
from qwen_asr import Qwen3ASRModel

# 方式一：使用GPU（推荐）
model = Qwen3ASRModel.from_pretrained(
    "Qwen/Qwen3-ASR-1.7B",
    dtype=torch.bfloat16,  # 用bfloat16节省显存
    device_map="cuda:0",   # 指定使用第一块GPU
    max_inference_batch_size=32,  # 批处理大小
    max_new_tokens=256,    # 最大生成token数
)

# 方式二：使用CPU（速度慢，仅测试用）
model = Qwen3ASRModel.from_pretrained(
    "Qwen/Qwen3-ASR-1.7B",
    device_map="cpu",
)

print("模型加载成功！")

这里有几个参数需要根据你的实际情况调整：

dtype：模型精度。torch.bfloat16在保持精度的同时能省不少显存，如果你的GPU支持的话，强烈推荐用这个。
device_map：设备映射。可以指定具体的GPU，比如"cuda:0"、"cuda:1"，或者用"auto"让系统自动分配。
max_inference_batch_size：批处理大小。如果你的显存够大（比如24GB以上），可以调大这个值，提高处理效率。

4. GPU资源优化技巧

如果你的服务器有GPU，这部分内容能帮你把硬件性能榨干。如果没有GPU，可以跳过直接看下一节。

4.1 显存优化策略

Qwen3-ASR-1.7B在推理时大概需要4-6GB显存，具体取决于批处理大小和音频长度。下面是一些优化显存使用的方法：

# 方法1：使用混合精度推理
model = Qwen3ASRModel.from_pretrained(
    "Qwen/Qwen3-ASR-1.7B",
    torch_dtype=torch.float16,  # 半精度，显存减半
    device_map="cuda:0",
)

# 方法2：启用CPU卸载（显存不够时把部分层放到CPU）
model = Qwen3ASRModel.from_pretrained(
    "Qwen/Qwen3-ASR-1.7B",
    device_map="auto",
    offload_folder="offload",  # 临时文件目录
)

# 方法3：分块处理长音频
def process_long_audio(audio_path, chunk_duration=30):
    """处理超长音频，分块推理"""
    import librosa
    from pydub import AudioSegment
    
    audio = AudioSegment.from_file(audio_path)
    chunks = []
    
    # 按30秒分块
    for i in range(0, len(audio), chunk_duration * 1000):
        chunk = audio[i:i + chunk_duration * 1000]
        chunk_path = f"temp_chunk_{i//1000}.wav"
        chunk.export(chunk_path, format="wav")
        
        # 处理每个分块
        result = model.transcribe(chunk_path)
        chunks.append(result[0].text)
    
    return " ".join(chunks)

4.2 使用vLLM加速

如果你要处理大量音频或者需要高并发，vLLM能带来显著的性能提升。vLLM是一个专门优化大模型推理的库，能提高吞吐量。

# 首先确保安装了vLLM版本
pip install qwen-asr[vllm]

然后可以用vLLM后端启动服务：

# 启动vLLM服务
qwen-asr-serve Qwen/Qwen3-ASR-1.7B \
    --gpu-memory-utilization 0.8 \
    --host 0.0.0.0 \
    --port 8000 \
    --max-model-len 4096

参数说明：

--gpu-memory-utilization 0.8：GPU显存使用率，0.8表示使用80%的显存
--host 0.0.0.0：监听所有网络接口
--port 8000：服务端口
--max-model-len 4096：最大序列长度

服务启动后，就可以通过HTTP API调用了：

import requests
import json

def transcribe_with_api(audio_url):
    url = "http://localhost:8000/v1/chat/completions"
    headers = {"Content-Type": "application/json"}
    
    data = {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "audio_url",
                        "audio_url": {"url": audio_url}
                    }
                ]
            }
        ]
    }
    
    response = requests.post(url, headers=headers, json=data, timeout=300)
    result = response.json()
    return result['choices'][0]['message']['content']

# 使用示例
text = transcribe_with_api("https://example.com/audio.wav")
print(text)

5. 基础使用与测试

环境搭好了，模型也加载了，现在该试试效果了。我们从最简单的开始，逐步深入。

5.1 第一个识别示例

先来个最简单的，识别一个本地音频文件：

# 识别本地音频文件
results = model.transcribe(
    audio="path/to/your/audio.wav",  # 支持wav、mp3、flac等格式
    language=None,  # 设为None自动检测语言，也可以指定如"Chinese"、"English"
)

print(f"检测到的语言: {results[0].language}")
print(f"识别结果: {results[0].text}")
print(f"时间戳: {results[0].timestamps}")  # 如果有的话

如果一切正常，你应该能看到音频的转写结果。第一次推理可能会慢一些，因为要加载模型权重到GPU。

5.2 处理在线音频

模型也支持直接处理网络音频，不用先下载到本地：

# 识别在线音频
results = model.transcribe(
    audio="https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen3-ASR-Repo/asr_en.wav",
    language="English",  # 明确指定英语
)

print(f"English audio: {results[0].text}")

5.3 批量处理多个文件

如果你有一批音频文件要处理，可以用批处理模式，效率高很多：

import os
from glob import glob

def batch_transcribe(audio_dir, output_file="results.txt"):
    """批量处理目录下的所有音频文件"""
    audio_files = glob(os.path.join(audio_dir, "*.wav")) + \
                  glob(os.path.join(audio_dir, "*.mp3"))
    
    with open(output_file, "w", encoding="utf-8") as f:
        for audio_file in audio_files:
            try:
                print(f"处理: {audio_file}")
                results = model.transcribe(audio=audio_file)
                
                f.write(f"文件: {audio_file}\n")
                f.write(f"语言: {results[0].language}\n")
                f.write(f"文本: {results[0].text}\n")
                f.write("-" * 50 + "\n")
                
            except Exception as e:
                print(f"处理失败 {audio_file}: {e}")
                f.write(f"文件: {audio_file} [处理失败: {e}]\n")

# 使用示例
batch_transcribe("/path/to/audio/files")

6. 高级功能探索

Qwen3-ASR-1.7B不止基础识别，还有一些高级功能值得试试。

6.1 流式识别

流式识别适合实时场景，比如语音助手、实时字幕等。音频一边输入，模型一边输出结果：

import numpy as np
import soundfile as sf
from qwen_asr import Qwen3ASRModel

# 加载流式识别模型
asr = Qwen3ASRModel.LLM(
    model="Qwen/Qwen3-ASR-1.7B",
    gpu_memory_utilization=0.8,
    max_new_tokens=32,  # 流式识别设置小一点
)

def streaming_example(audio_path, chunk_ms=1000):
    """流式识别示例"""
    # 读取音频并重采样到16kHz
    wav, sr = sf.read(audio_path, dtype="float32")
    if sr != 16000:
        # 简单重采样到16kHz
        duration = len(wav) / sr
        wav_16k = np.interp(
            np.linspace(0, duration, int(duration * 16000)),
            np.linspace(0, duration, len(wav)),
            wav
        )
    else:
        wav_16k = wav
    
    # 初始化流式状态
    state = asr.init_streaming_state(
        unfixed_chunk_num=2,
        unfixed_token_num=5,
        chunk_size_sec=2.0,
    )
    
    # 模拟流式输入（每chunk_ms毫秒输入一次）
    step = int(chunk_ms / 1000 * 16000)
    pos = 0
    chunk_id = 0
    
    while pos < len(wav_16k):
        chunk = wav_16k[pos:pos + step]
        pos += len(chunk)
        chunk_id += 1
        
        # 流式识别
        asr.streaming_transcribe(chunk, state)
        
        # 打印中间结果
        if chunk_id % 5 == 0:  # 每5个chunk打印一次
            print(f"[Chunk {chunk_id}] 当前识别: {state.text}")
    
    # 最终结果
    asr.finish_streaming_transcribe(state)
    print(f"最终结果: {state.text}")
    return state.text

6.2 强制对齐（时间戳）

如果你需要知道每个词在音频中的具体位置，可以用强制对齐功能：

# 注意：强制对齐需要额外的模型Qwen3-ForcedAligner-0.6B
from modelscope import snapshot_download

# 下载对齐模型
aligner_dir = snapshot_download('Qwen/Qwen3-ForcedAligner-0.6B')

# 使用对齐功能（具体API可能略有不同，参考官方文档）
results = model.transcribe(
    audio="audio.wav",
    language="Chinese",
    return_timestamps=True,  # 返回时间戳
)

# 输出带时间戳的结果
for segment in results[0].segments:
    print(f"[{segment.start:.2f}s - {segment.end:.2f}s]: {segment.text}")

6.3 多语言和方言识别

Qwen3-ASR-1.7B支持52种语言和方言，你可以试试不同的语言：

# 测试不同语言
test_cases = [
    ("https://example.com/chinese.wav", "Chinese"),
    ("https://example.com/english.wav", "English"),
    ("https://example.com/japanese.wav", "Japanese"),
    ("https://example.com/korean.wav", "Korean"),
    ("https://example.com/french.wav", "French"),
]

for audio_url, lang in test_cases:
    try:
        results = model.transcribe(audio=audio_url, language=lang)
        print(f"{lang}: {results[0].text[:100]}...")  # 只打印前100字符
    except Exception as e:
        print(f"{lang} 识别失败: {e}")

7. 性能测试与监控

部署完了，总得知道它跑得怎么样吧？这里分享一些性能测试和监控的方法。

7.1 基础性能测试

写个简单的测试脚本，看看模型的识别速度和准确率：

import time
import torch
from qwen_asr import Qwen3ASRModel

def benchmark_model(audio_path, num_runs=10):
    """基准测试：测量推理速度"""
    model = Qwen3ASRModel.from_pretrained(
        "Qwen/Qwen3-ASR-1.7B",
        torch_dtype=torch.float16,
        device_map="cuda:0" if torch.cuda.is_available() else "cpu",
    )
    
    times = []
    for i in range(num_runs):
        start_time = time.time()
        
        results = model.transcribe(audio=audio_path)
        
        end_time = time.time()
        times.append(end_time - start_time)
        
        if i == 0:
            print(f"第一次识别结果: {results[0].text[:50]}...")
    
    avg_time = sum(times) / len(times)
    print(f"\n性能测试结果:")
    print(f"平均推理时间: {avg_time:.2f}秒")
    print(f"最快: {min(times):.2f}秒")
    print(f"最慢: {max(times):.2f}秒")
    print(f"音频长度: 约{len(times[0])/16000:.1f}秒")
    
    # 计算实时率（RTF）
    audio_duration = len(times[0]) / 16000  # 假设16kHz采样率
    rtf = avg_time / audio_duration
    print(f"实时率（RTF）: {rtf:.3f} (小于1表示快于实时)")

# 运行测试
benchmark_model("test_audio.wav")

7.2 GPU监控

如果用了GPU，监控一下资源使用情况：

# 监控GPU使用情况
watch -n 1 nvidia-smi

# 或者用更详细的工具
pip install gpustat
gpustat -i 1  # 每秒刷新一次

你也可以在Python代码里监控：

import torch
import psutil
import time

def monitor_resources(duration=60):
    """监控系统资源使用"""
    print("开始监控资源使用...")
    print("时间戳 | GPU显存(MB) | GPU利用率(%) | CPU(%) | 内存(%)")
    print("-" * 60)
    
    for i in range(duration):
        # GPU信息
        if torch.cuda.is_available():
            gpu_mem = torch.cuda.memory_allocated() / 1024**2
            gpu_util = torch.cuda.utilization()
        else:
            gpu_mem = gpu_util = 0
        
        # CPU和内存
        cpu_percent = psutil.cpu_percent()
        mem_percent = psutil.virtual_memory().percent
        
        print(f"{i:3d}s | {gpu_mem:10.1f} | {gpu_util:12.1f} | {cpu_percent:5.1f} | {mem_percent:6.1f}")
        time.sleep(1)

7.3 常见问题排查

部署过程中可能会遇到一些问题，这里列几个常见的：

# 问题1：CUDA out of memory（显存不足）
# 解决方法：
# 1. 减小批处理大小
model = Qwen3ASRModel.from_pretrained(..., max_inference_batch_size=8)

# 2. 使用半精度
model = Qwen3ASRModel.from_pretrained(..., torch_dtype=torch.float16)

# 3. 启用CPU卸载
model = Qwen3ASRModel.from_pretrained(..., device_map="auto", offload_folder="offload")

# 问题2：下载模型慢
# 解决方法：
# 设置环境变量使用国内镜像
import os
os.environ['MODELSCOPE_CACHE'] = '/path/to/cache'
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

# 问题3：音频格式不支持
# 解决方法：
# 转换为支持的格式（如wav）
from pydub import AudioSegment
audio = AudioSegment.from_file("input.mp3")
audio.export("converted.wav", format="wav")

8. 生产环境部署建议

如果你打算在生产环境使用，下面这些建议可能对你有帮助。

8.1 使用Docker容器化

用Docker部署可以保证环境一致性，也方便扩展：

# Dockerfile示例
FROM nvidia/cuda:12.1.1-runtime-ubuntu22.04

# 安装系统依赖
RUN apt-get update && apt-get install -y \
    python3.10 \
    python3-pip \
    ffmpeg \
    && rm -rf /var/lib/apt/lists/*

# 设置工作目录
WORKDIR /app

# 复制代码
COPY requirements.txt .
COPY app.py .

# 安装Python依赖
RUN pip3 install --no-cache-dir -r requirements.txt

# 下载模型（可以在构建时下载，也可以运行时下载）
# RUN python3 -c "from modelscope import snapshot_download; snapshot_download('Qwen/Qwen3-ASR-1.7B')"

# 启动服务
CMD ["python3", "app.py"]

对应的requirements.txt：

torch==2.1.0
qwen-asr[vllm]
modelscope
soundfile
pydub
fastapi
uvicorn

8.2 创建简单的Web服务

用FastAPI包装一下，提供HTTP API：

# app.py
from fastapi import FastAPI, File, UploadFile
from fastapi.responses import JSONResponse
import tempfile
import os
from qwen_asr import Qwen3ASRModel
import torch

app = FastAPI(title="Qwen3-ASR API")

# 全局模型实例
model = None

@app.on_event("startup")
async def startup_event():
    """启动时加载模型"""
    global model
    print("正在加载模型...")
    model = Qwen3ASRModel.from_pretrained(
        "Qwen/Qwen3-ASR-1.7B",
        torch_dtype=torch.float16,
        device_map="cuda:0" if torch.cuda.is_available() else "cpu",
    )
    print("模型加载完成")

@app.post("/transcribe")
async def transcribe_audio(
    file: UploadFile = File(...),
    language: str = None,
):
    """音频转写接口"""
    try:
        # 保存上传的临时文件
        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp:
            content = await file.read()
            tmp.write(content)
            tmp_path = tmp.name
        
        # 调用模型识别
        results = model.transcribe(
            audio=tmp_path,
            language=language,
        )
        
        # 清理临时文件
        os.unlink(tmp_path)
        
        return JSONResponse({
            "success": True,
            "language": results[0].language,
            "text": results[0].text,
            "timestamps": results[0].timestamps if hasattr(results[0], 'timestamps') else None,
        })
        
    except Exception as e:
        return JSONResponse({
            "success": False,
            "error": str(e),
        }, status_code=500)

@app.get("/health")
async def health_check():
    """健康检查"""
    return {"status": "healthy", "model_loaded": model is not None}

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

启动服务：

python app.py
# 或者用uvicorn
uvicorn app:app --host 0.0.0.0 --port 8000 --reload

8.3 配置优化建议

根据你的使用场景，调整这些配置：

# 配置示例：根据场景优化
configs = {
    "实时场景": {
        "torch_dtype": torch.float16,
        "max_inference_batch_size": 1,
        "use_vllm": True,
        "gpu_memory_utilization": 0.7,
    },
    "批量处理": {
        "torch_dtype": torch.float16,
        "max_inference_batch_size": 32,
        "use_vllm": True,
        "gpu_memory_utilization": 0.9,
    },
    "边缘设备": {
        "torch_dtype": torch.float16,
        "device_map": "cpu",  # 或者用Qwen3-ASR-0.6B小模型
        "max_inference_batch_size": 1,
        "use_vllm": False,
    },
}

# 根据场景选择配置
scene = "批量处理"
config = configs[scene]

model = Qwen3ASRModel.from_pretrained(
    "Qwen/Qwen3-ASR-1.7B",
    torch_dtype=config["torch_dtype"],
    device_map="cuda:0" if torch.cuda.is_available() and config.get("device_map") != "cpu" else "cpu",
    max_inference_batch_size=config["max_inference_batch_size"],
)

总结

走完这一整套流程，你应该已经在Linux上成功部署了Qwen3-ASR-1.7B。从环境准备到生产部署，每个环节我都尽量把可能遇到的问题和解决方案讲清楚。

实际用下来，这个模型的效果确实不错，特别是对中文和方言的支持很到位。部署过程虽然看起来步骤不少，但一步步跟着做，基本上不会有大问题。如果遇到显存不足，可以试试换用0.6B的小版本，或者调整批处理大小。

性能方面，在合适的GPU上，实时率能到0.5以下，意味着处理速度比实时播放还快一倍。对于大多数应用场景来说，这个性能已经足够用了。

最后提醒一下，如果是生产环境使用，记得做好错误处理和日志记录，毕竟音频文件的格式千奇百怪，难免会遇到一些特殊情况。还有就是要监控资源使用，特别是GPU显存，避免因为内存泄漏导致服务崩溃。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git