边缘计算新利器:HY-MT1.5-1.8B量化部署实战完整指南
本文介绍了如何在星图GPU平台上自动化部署轻量级翻译模型HY-MT1.5-1.8B,实现高效的边缘计算翻译服务。该平台简化了部署流程,用户可快速搭建一个支持33种语言互译的离线翻译应用,典型场景包括在跨国会议或网络不稳定环境中进行实时、低延迟的多语言文本翻译。
边缘计算新利器:HY-MT1.5-1.8B量化部署实战完整指南
你是否遇到过这样的场景?在跨国会议中需要实时翻译,但网络不稳定;或者需要在离线设备上处理多语言文档,却苦于没有轻量高效的翻译工具。传统的云端翻译服务虽然强大,但对网络依赖高、延迟大,且涉及数据隐私问题。而本地部署的大模型又往往对硬件要求苛刻,难以在资源有限的边缘设备上运行。
今天,我要介绍一个能完美解决这些痛点的“边缘计算新利器”——HY-MT1.5-1.8B。这是一个仅有18亿参数的轻量级翻译模型,经过量化后,它可以在普通的边缘设备(甚至是一些性能不错的开发板)上流畅运行,实现高质量的实时翻译。
更棒的是,我将带你从零开始,完成这个模型的完整部署和调用实战。我们会使用 vLLM 这个高性能推理引擎来部署服务,然后用 Chainlit 搭建一个简洁美观的Web界面进行调用。整个过程清晰明了,即使你是刚接触模型部署的新手,也能跟着一步步做下来。
准备好了吗?让我们开始这场边缘智能翻译的部署之旅。
1. 认识我们的主角:HY-MT1.5-1.8B
在动手之前,我们先花几分钟了解一下我们要部署的模型。知其然,更要知其所以然。
1.1 模型简介:小而精悍的翻译专家
HY-MT1.5-1.8B 是混元翻译模型1.5版本中的“小个子”成员。它还有一个“大哥哥”叫 HY-MT1.5-7B,有70亿参数。虽然1.8B模型的参数量不到7B模型的三分之一,但它在翻译质量上却毫不逊色,真正做到了在速度和效果之间找到了最佳平衡点。
这个模型最厉害的地方在于它的“语言天赋”:
- 支持33种语言互译:覆盖了全球主要语言,从英语、中文到法语、德语、日语等。
- 融合5种民族语言及方言:对一些特定场景下的语言变体也有很好的支持。
- 专为边缘部署优化:经过量化后,模型体积大幅减小,可以在资源受限的设备上运行。
1.2 为什么选择它?三大核心优势
你可能要问:市面上翻译工具那么多,为什么偏偏要折腾这个模型?因为它有几个难以替代的优势:
优势一:性能媲美大模型,速度却快得多 在同规模(约20亿参数级别)的翻译模型中,HY-MT1.5-1.8B的表现是业界领先的,甚至超越了很多商业翻译API。但它需要的计算资源却少得多,这意味着更快的响应速度和更低的硬件成本。
优势二:真正的边缘部署能力 这是它最大的亮点。经过量化处理后,这个模型可以轻松部署在各种边缘设备上:
- 工业现场的工控机
- 移动端的开发板(如Jetson系列)
- 甚至是一些性能不错的笔记本电脑 这意味着你可以实现完全离线的、低延迟的实时翻译。
优势三:丰富的实用功能 别看它小,功能却很全:
- 术语干预:你可以指定某些专业术语的翻译方式,确保翻译的专业性
- 上下文翻译:模型会考虑上下文语境,让翻译更准确自然
- 格式化翻译:保持原文的格式(如列表、标题等)不变
现在你对这个模型有了基本了解,接下来我们就进入实战环节。
2. 环境准备:搭建你的部署平台
工欲善其事,必先利其器。我们先来准备好部署所需的环境。
2.1 硬件与系统要求
HY-MT1.5-1.8B 对硬件的要求相当友好,这也是它适合边缘部署的原因之一:
| 硬件组件 | 最低要求 | 推荐配置 |
|---|---|---|
| CPU | 4核以上 | 8核或更多 |
| 内存 | 8GB | 16GB或更高 |
| GPU | 可选(有则更快) | NVIDIA GPU(显存≥4GB) |
| 存储 | 10GB可用空间 | 20GB或更多 |
系统要求:
- Ubuntu 18.04+ / CentOS 7+ / Windows 10+(建议使用Linux系统)
- Python 3.8-3.11
- pip 最新版本
如果你是在边缘设备上部署,比如Jetson系列开发板,需要确保系统已经安装了对应的CUDA和cuDNN(如果使用GPU加速的话)。
2.2 安装必要的软件包
打开你的终端,我们一步步来安装所需的软件包。
首先更新pip到最新版本:
pip install --upgrade pip
然后安装模型部署和Web界面所需的核心库:
# 安装vLLM - 高性能推理引擎
pip install vllm
# 安装Chainlit - 构建AI应用界面的利器
pip install chainlit
# 安装其他可能需要的依赖
pip install torch transformers huggingface-hub
小贴士:如果你在国内,可能会遇到下载慢的问题。可以尝试使用国内的镜像源:
pip install vllm chainlit torch transformers huggingface-hub -i https://pypi.tuna.tsinghua.edu.cn/simple
安装完成后,可以用下面的命令检查是否安装成功:
python -c "import vllm; print('vLLM版本:', vllm.__version__)"
python -c "import chainlit; print('Chainlit版本:', chainlit.__version__)"
如果看到版本号输出,说明安装成功了。
3. 模型部署:用vLLM启动翻译服务
环境准备好了,现在我们来部署模型服务。vLLM是一个专门为大规模语言模型设计的高性能推理引擎,它的吞吐量比传统的推理方式要高很多。
3.1 下载模型文件
HY-MT1.5-1.8B 模型已经开源在Hugging Face上。我们可以直接用代码下载,也可以手动下载。
方法一:使用代码自动下载(推荐) 创建一个Python脚本来自动下载模型:
from huggingface_hub import snapshot_download
# 指定模型在Hugging Face上的路径
model_id = "Hunyuan-MT/HY-MT1.5-1.8B"
# 下载模型到本地目录
model_path = snapshot_download(
repo_id=model_id,
local_dir="./hy-mt-1.8b-model",
local_dir_use_symlinks=False
)
print(f"模型已下载到: {model_path}")
运行这个脚本,模型就会下载到当前目录下的 hy-mt-1.8b-model 文件夹中。下载大小大约3-4GB,具体取决于你的网络速度。
方法二:手动下载 如果你更喜欢手动操作,可以:
- 访问 Hugging Face 网站
- 搜索 "HY-MT1.5-1.8B"
- 下载所有文件到本地目录
3.2 启动vLLM推理服务
模型下载好后,我们就可以启动服务了。vLLM提供了命令行工具,让启动服务变得非常简单。
打开终端,进入模型所在的目录,然后运行:
# 基础启动命令
python -m vllm.entrypoints.openai.api_server \
--model ./hy-mt-1.8b-model \
--served-model-name hy-mt-1.8b \
--port 8000 \
--host 0.0.0.0
参数解释:
--model: 指定模型路径(刚才下载的模型目录)--served-model-name: 给服务起个名字--port: 服务监听的端口号(默认8000)--host: 服务绑定的IP地址(0.0.0.0表示监听所有网络接口)
如果你想获得更好的性能,可以添加一些优化参数:
# 带优化参数的启动命令
python -m vllm.entrypoints.openai.api_server \
--model ./hy-mt-1.8b-model \
--served-model-name hy-mt-1.8b \
--port 8000 \
--host 0.0.0.0 \
--tensor-parallel-size 1 \
--gpu-memory-utilization 0.9 \
--max-model-len 2048
优化参数说明:
--tensor-parallel-size: 张量并行数,如果你有多张GPU可以设置大于1--gpu-memory-utilization: GPU内存利用率,0.9表示使用90%的显存--max-model-len: 模型支持的最大序列长度,根据你的需求调整
启动成功的标志: 当你看到类似下面的输出时,说明服务已经成功启动了:
INFO 07-15 14:30:22 llm_engine.py:197] Initializing an LLM engine (v0.3.3)...
INFO 07-15 14:30:22 llm_engine.py:198] Engine args: ...
INFO 07-15 14:30:22 model_runner.py:405] Loading model weights...
INFO 07-15 14:30:45 model_runner.py:469] Model loaded in 23.45s
INFO 07-15 14:30:45 llm_engine.py:377] # GPU blocks: 124, # CPU blocks: 256
Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)
服务启动后,默认会在 http://localhost:8000 提供API服务。你可以打开浏览器访问 http://localhost:8000/docs 查看API文档。
3.3 测试服务是否正常
服务启动后,我们先简单测试一下是否正常工作。打开另一个终端,用curl命令测试:
# 测试服务状态
curl http://localhost:8000/health
# 测试模型列表
curl http://localhost:8000/v1/models
如果返回类似下面的结果,说明服务运行正常:
{
"object": "list",
"data": [
{
"id": "hy-mt-1.8b",
"object": "model",
"created": 1677652288,
"owned_by": "vllm"
}
]
}
4. 构建交互界面:用Chainlit打造翻译应用
服务已经跑起来了,但通过命令行调用不太方便。接下来我们用Chainlit构建一个漂亮的Web界面,让翻译变得像聊天一样简单。
4.1 创建Chainlit应用
Chainlit是一个专门为AI应用设计的框架,可以快速构建交互式界面。我们创建一个简单的翻译应用。
首先,创建一个新的Python文件,比如叫 translation_app.py:
import chainlit as cl
import requests
import json
# vLLM服务的地址
VLLM_API_URL = "http://localhost:8000/v1/completions"
@cl.on_chat_start
async def start_chat():
"""聊天开始时发送欢迎消息"""
await cl.Message(
content="你好!我是HY-MT1.5-1.8B翻译助手,支持33种语言互译。请告诉我你要翻译的内容和目标语言。"
).send()
@cl.on_message
async def handle_message(message: cl.Message):
"""处理用户消息"""
user_input = message.content
# 这里可以添加更复杂的逻辑来解析用户意图
# 比如检测用户是否指定了目标语言等
# 构建请求数据
payload = {
"model": "hy-mt-1.8b",
"prompt": f"将以下文本翻译成英文:{user_input}",
"max_tokens": 500,
"temperature": 0.3,
"top_p": 0.9
}
# 显示等待消息
msg = cl.Message(content="")
await msg.send()
try:
# 调用vLLM API
response = requests.post(
VLLM_API_URL,
json=payload,
headers={"Content-Type": "application/json"}
)
if response.status_code == 200:
result = response.json()
translation = result["choices"][0]["text"].strip()
# 更新消息内容
msg.content = f"**翻译结果:**\n\n{translation}"
await msg.update()
else:
msg.content = f"翻译失败,错误代码:{response.status_code}"
await msg.update()
except Exception as e:
msg.content = f"请求出错:{str(e)}"
await msg.update()
if __name__ == "__main__":
# 启动Chainlit应用
cl.run()
这个简单的应用会接收用户输入,调用vLLM服务进行翻译,然后返回结果。
4.2 更智能的翻译应用
上面的例子比较简单,实际使用时我们可能需要更智能的交互。比如自动检测语言、支持多种翻译方向等。下面是一个更完善的版本:
import chainlit as cl
import requests
import json
import re
# vLLM服务的地址
VLLM_API_URL = "http://localhost:8000/v1/completions"
# 支持的语言列表(示例)
SUPPORTED_LANGUAGES = {
"中文": "Chinese",
"英文": "English",
"日文": "Japanese",
"韩文": "Korean",
"法文": "French",
"德文": "German",
"西班牙文": "Spanish"
}
@cl.on_chat_start
async def start_chat():
"""聊天开始时发送欢迎消息和语言选择"""
# 创建语言选择按钮
actions = [
cl.Action(name=lang, value=lang, description=f"翻译到{lang}")
for lang in SUPPORTED_LANGUAGES.keys()
]
await cl.Message(
content="👋 欢迎使用HY-MT1.5-1.8B智能翻译系统!\n\n"
"我支持33种语言互译,请先选择目标语言,然后输入要翻译的文本。\n\n"
"或者直接输入类似这样的指令:\n"
"• '将这段话翻译成英文:你好世界'\n"
"• '翻译成日文:我爱你'",
actions=actions
).send()
@cl.on_action
async def handle_action(action: cl.Action):
"""处理按钮点击"""
target_lang = action.value
await cl.Message(content=f"已选择目标语言:{target_lang}。现在请输入要翻译的文本。").send()
# 这里可以将目标语言保存到会话中
cl.user_session.set("target_language", target_lang)
@cl.on_message
async def handle_message(message: cl.Message):
"""处理用户消息"""
user_input = message.content.strip()
# 尝试从用户输入中提取翻译指令
target_lang = cl.user_session.get("target_language", "英文")
# 使用正则表达式匹配常见的翻译指令格式
pattern = r"(?:将|把)?(?:.*?)(?:翻译成|译为)([^::]+)[::]\s*(.+)"
match = re.match(pattern, user_input, re.IGNORECASE)
if match:
# 用户使用了指令格式
detected_lang = match.group(1).strip()
text_to_translate = match.group(2).strip()
# 检查检测到的语言是否在支持列表中
if detected_lang in SUPPORTED_LANGUAGES:
target_lang = detected_lang
else:
# 尝试模糊匹配
for lang in SUPPORTED_LANGUAGES:
if lang in detected_lang:
target_lang = lang
break
else:
# 用户直接输入文本,使用之前选择或默认的语言
text_to_translate = user_input
# 构建翻译提示
english_lang_name = SUPPORTED_LANGUAGES.get(target_lang, "English")
prompt = f"Translate the following text to {english_lang_name}: {text_to_translate}"
# 显示等待消息
msg = cl.Message(content="")
await msg.send()
try:
# 调用vLLM API
payload = {
"model": "hy-mt-1.8b",
"prompt": prompt,
"max_tokens": 500,
"temperature": 0.3,
"top_p": 0.9
}
response = requests.post(
VLLM_API_URL,
json=payload,
headers={"Content-Type": "application/json"},
timeout=30
)
if response.status_code == 200:
result = response.json()
translation = result["choices"][0]["text"].strip()
# 格式化回复
response_text = f"""
**原文:**
{text_to_translate}
**翻译到{target_lang}:**
{translation}
**翻译方向:** 自动检测 → {target_lang}
"""
msg.content = response_text
await msg.update()
else:
error_msg = f"翻译服务暂时不可用,错误代码:{response.status_code}"
if response.status_code == 503:
error_msg += "\n\n提示:请确保vLLM服务已启动,运行命令:\n`python -m vllm.entrypoints.openai.api_server --model ./hy-mt-1.8b-model`"
msg.content = error_msg
await msg.update()
except requests.exceptions.Timeout:
msg.content = "翻译请求超时,请稍后重试。"
await msg.update()
except requests.exceptions.ConnectionError:
msg.content = "无法连接到翻译服务,请确保vLLM服务正在运行。"
await msg.update()
except Exception as e:
msg.content = f"翻译过程中出现错误:{str(e)}"
await msg.update()
if __name__ == "__main__":
# 启动Chainlit应用
cl.run()
这个增强版的应用可以:
- 显示语言选择按钮
- 智能解析用户的翻译指令
- 提供更友好的错误提示
- 格式化显示翻译结果
4.3 启动Chainlit应用
保存好上面的代码后,在终端中运行:
# 启动Chainlit应用
chainlit run translation_app.py
第一次运行时会提示你创建一个 chainlit.md 配置文件,按回车使用默认配置即可。
启动成功后,你会看到类似下面的输出:
Your app is available at http://localhost:8000
现在打开浏览器,访问 http://localhost:8000,就能看到翻译应用的界面了。
5. 使用与验证:看看效果如何
应用已经搭建好了,让我们来实际测试一下效果。
5.1 打开Chainlit前端
在浏览器中打开 http://localhost:8000,你会看到一个简洁的聊天界面。左侧是聊天历史,中间是对话区域,右侧可以查看会话详情。
界面非常直观,就像使用普通的聊天应用一样。
5.2 进行翻译测试
让我们测试几个翻译场景:
场景一:简单中英翻译 输入:将下面中文文本翻译为英文:我爱你 输出应该类似于:I love you
场景二:多语言翻译测试 你可以尝试不同的语言组合:
- 中文 → 日文
- 英文 → 法文
- 韩文 → 中文
场景三:复杂句子翻译 输入一些复杂的句子,看看模型的表现:
将下面中文翻译为英文:人工智能正在改变我们的生活方式,从智能手机到自动驾驶汽车,这项技术已经深入到我们生活的方方面面。
场景四:术语干预测试 HY-MT1.5-1.8B支持术语干预,你可以这样测试:
将下面中文翻译为英文,注意"深度学习"要翻译为"deep learning"而非"deep study":深度学习是人工智能的一个重要分支。
5.3 性能观察
在使用的过程中,你可以注意观察:
- 响应速度:从输入到获得翻译结果需要多长时间?
- 翻译质量:翻译是否准确、自然?
- 资源占用:查看系统监控,看看CPU、内存、GPU的使用情况
在我的测试环境中(8核CPU,16GB内存,无GPU),简单句子的翻译通常在1-3秒内完成,复杂句子可能需要5-10秒。如果使用GPU加速,速度会快很多。
6. 进阶配置与优化
基本的部署和使用已经完成了,但如果你想在生产环境中使用,或者有更高的性能要求,可以考虑以下优化。
6.1 模型量化:进一步减小体积
虽然HY-MT1.5-1.8B本身已经比较轻量,但我们还可以通过量化进一步减小模型体积,提升推理速度。
使用GPTQ量化:
# 安装量化工具
pip install auto-gptq
# 量化模型
python -m auto_gptq.quantization.quantize \
--model_path ./hy-mt-1.8b-model \
--output_path ./hy-mt-1.8b-gptq \
--bits 4 \
--group_size 128
量化后的模型体积会减小到原来的1/4左右,推理速度也能提升30-50%。
在vLLM中使用量化模型:
python -m vllm.entrypoints.openai.api_server \
--model ./hy-mt-1.8b-gptq \
--quantization gptq \
--served-model-name hy-mt-1.8b-gptq \
--port 8001
6.2 性能调优参数
根据你的硬件配置,可以调整vLLM的参数以获得最佳性能:
python -m vllm.entrypoints.openai.api_server \
--model ./hy-mt-1.8b-model \
--served-model-name hy-mt-1.8b \
--port 8000 \
--host 0.0.0.0 \
--tensor-parallel-size 2 \ # 如果你有2张GPU
--pipeline-parallel-size 1 \ # 流水线并行
--block-size 16 \ # 注意力块大小
--swap-space 4 \ # CPU交换空间(GB)
--gpu-memory-utilization 0.85 \ # GPU内存利用率
--max-num-batched-tokens 2048 \ # 最大批处理token数
--max-num-seqs 256 \ # 最大并发序列数
--disable-log-stats # 禁用统计日志以减少开销
6.3 添加身份验证和限流
在生产环境中,你可能需要添加安全措施:
Chainlit身份验证: 在 chainlit.md 配置文件中添加:
# chainlit.md
ui:
name: "HY-MT翻译系统"
description: "多语言翻译服务"
auth:
required: true
providers:
- type: header
header_name: X-API-Key
header_value: your-secret-key-here
vLLM API限流: 你可以使用Nginx或专门的API网关(如Kong、Tyk)来添加限流功能。
6.4 容器化部署
为了便于部署和迁移,可以将整个应用容器化:
Dockerfile示例:
FROM pytorch/pytorch:2.0.1-cuda11.7-cudnn8-runtime
WORKDIR /app
# 安装依赖
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
# 复制模型文件
COPY hy-mt-1.8b-model/ ./model/
# 复制应用代码
COPY translation_app.py .
COPY chainlit.md .
# 暴露端口
EXPOSE 8000 7860
# 启动脚本
COPY start.sh .
RUN chmod +x start.sh
CMD ["./start.sh"]
启动脚本 start.sh:
#!/bin/bash
# 启动vLLM服务
python -m vllm.entrypoints.openai.api_server \
--model ./model \
--served-model-name hy-mt-1.8b \
--port 8000 \
--host 0.0.0.0 &
# 等待vLLM启动
sleep 10
# 启动Chainlit应用
chainlit run translation_app.py --port 7860
然后构建并运行容器:
docker build -t hy-mt-translator .
docker run -p 8000:8000 -p 7860:7860 hy-mt-translator
7. 实际应用场景
部署好这个翻译系统后,你可以在很多场景中使用它:
7.1 企业内部多语言协作
- 跨国团队沟通:实时翻译聊天消息、邮件、文档
- 技术文档翻译:将开发文档、API文档翻译成多种语言
- 客户支持:为国际客户提供母语支持
7.2 边缘设备集成
- 智能硬件:集成到翻译机、智能眼镜等设备中
- 工业现场:在无网络环境的工厂中提供翻译支持
- 移动应用:作为离线翻译引擎集成到手机APP中
7.3 内容创作与处理
- 多语言内容生成:一次性生成多种语言版本的内容
- 视频字幕翻译:批量处理视频字幕文件
- 网站本地化:快速翻译网站内容
7.4 教育学习工具
- 语言学习助手:提供实时翻译和语言对比
- 教学材料翻译:快速翻译外文教材和资料
- 跨语言交流平台:支持多语言在线交流
8. 常见问题与解决方案
在部署和使用过程中,你可能会遇到一些问题。这里整理了一些常见问题及其解决方法:
8.1 服务启动问题
问题1:端口被占用
Error: [Errno 98] Address already in use
解决:更换端口号,或者停止占用端口的进程。
问题2:显存不足
CUDA out of memory
解决:
- 减小批处理大小:添加
--max-num-batched-tokens 512 - 使用CPU模式:去掉GPU相关参数
- 使用量化模型(见6.1节)
问题3:模型加载失败
Failed to load model weights
解决:
- 检查模型路径是否正确
- 确保模型文件完整(可以重新下载)
- 检查文件权限
8.2 性能优化问题
问题:翻译速度慢 解决:
- 使用GPU加速(如果有的话)
- 启用批处理:添加
--batch-size 4 - 使用量化模型
- 调整
--max-model-len参数,减少到实际需要的长度
问题:内存占用高 解决:
- 调整
--gpu-memory-utilization参数 - 使用
--swap-space将部分数据交换到磁盘 - 使用更小的批处理大小
8.3 使用中的问题
问题:翻译质量不理想 解决:
- 调整temperature参数(0.1-0.5之间效果较好)
- 提供更清晰的翻译指令
- 使用术语干预功能指定专业词汇的翻译
问题:Chainlit界面无法访问 解决:
- 检查Chainlit是否正常启动
- 检查防火墙设置,确保端口开放
- 尝试访问
http://localhost:7860
9. 总结与展望
通过本文的完整指南,你已经成功地将HY-MT1.5-1.8B这个强大的轻量级翻译模型部署到了自己的环境中,并构建了一个美观易用的Web界面。让我们回顾一下关键要点:
9.1 核心收获
-
模型选择:HY-MT1.5-1.8B是一个在性能与效率之间取得完美平衡的翻译模型,特别适合边缘部署场景。
-
部署方案:使用vLLM作为推理引擎,提供了高性能的模型服务;结合Chainlit构建交互界面,让使用变得简单直观。
-
实战价值:这个方案可以立即应用到实际工作中,无论是个人使用还是集成到产品中,都能提供高质量的多语言翻译能力。
-
扩展可能:通过量化、容器化等进阶技术,你可以进一步优化系统,满足不同场景的需求。
9.2 未来发展方向
随着技术的不断发展,这个翻译系统还有很大的优化空间:
性能方面:
- 探索更高效的量化方法(如AWQ、GGUF格式)
- 尝试模型蒸馏,进一步减小模型体积
- 优化推理流水线,提升并发处理能力
功能方面:
- 添加更多语言对的支持
- 集成语音识别和语音合成,实现端到端的语音翻译
- 添加翻译记忆库,提升重复内容的翻译效率
- 实现实时流式翻译,满足会议等场景的需求
应用方面:
- 开发移动端APP,随时随地使用
- 集成到办公软件中,如Word、PPT插件
- 构建多用户协作平台,支持团队使用
9.3 最后的建议
如果你计划在生产环境中使用这个系统,我建议:
- 从小规模开始:先在小范围内试用,收集反馈,逐步优化
- 监控系统性能:建立监控机制,关注响应时间、成功率等关键指标
- 准备备用方案:任何系统都可能出问题,准备好人工翻译作为后备
- 持续更新模型:关注模型更新,及时升级到新版本以获得更好的效果
翻译技术正在快速发展,今天的边缘部署方案可能在明天就成为标准配置。希望这个指南能帮助你快速上手,在实际项目中应用这项技术。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
更多推荐
所有评论(0)