沐曦GPU安装大模型

本文介绍了在沐曦GPU上部署AI模型的关键步骤：1.通过mx-smi命令检查GPU驱动版本，建议选择与驱动版本匹配的沐曦官方镜像；2.从沐曦官网获取最新Docker镜像并部署；3.参考官方教程启动容器和模型。模型兼容性需满足三个条件：沐曦适配模型（可通过魔塔社区查询）、vllm版本支持的模型架构（需核对vllm官网文档）、以及bfloat16精度支持。特别提醒需注意maca版本与GPU驱动的匹配问

梁萌

210人浏览 · 2026-04-15 22:50:48

梁萌 · 2026-04-15 22:50:48 发布

1.查看当前GPU对应的驱动版本号

命令为 mx-smi

2.去沐曦官方网站，找镜像

https://developer.metax-tech.com/softnova/docker?chip_name=%E6%9B%A6%E4%BA%91C500%E7%B3%BB%E5%88%97&package_kind=AI&dimension=docker&deliver_type=%E5%88%86%E5%B1%82%E5%8C%85&ai_frame=vllm-metax

需要注意下镜像中的maca版本，跟服务器GPU的驱动版本尽量保持一致或相近。可以通过升级GPU驱动的方式，解决版本不一致问题。

3.一般情况，就找最新发布的镜像，点击镜像复制命令

复制后，到自己服务器上执行，就会下载这个镜像。

4.下载和启动模型

参考沐曦提供的模型部署教程，启动容器，在容器内部下载和启动模型

https://developer.metax-tech.com/doc/242

哪些模型可以部署在沐曦GPU上？

1.魔塔社区中，沐曦做了适配的模型

https://www.modelscope.cn/organization/metax-tech?tab=model

2.vllm版本支持的模型架构

根据下载的镜像的vllm版本，在vllm官方网站中，看该模型的架构是否支持。

先看镜像的vllm版本

如上图，镜像的vllm版本是0.17

然后去vllm官网，看0.17版本支持哪些模型架构

https://docs.vllm.ai/en/v0.17.0/models/supported_models/#pooling-models

假如想安装某个模型，打开这个模型的配置文件，找到模型架构

在vllm官网中，搜索该模型架构

这就说明vllm 0.17版本，支持该模型架构，是可以安装的。

3.看模型精度是否支持bfloat16

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git