docker 方式运行ollama 大模型

Ollama现在已有Docker hub开源的镜像提供，这使得使用Docker容器运行大型语言模型变得更加简单。有了Ollama，大型语言模型的所有交互都在本地进行，无需将数据发送给第三方服务。

大大宝的博客 · 2024-12-02 16:18:23 发布

Ollama通过GPU加速来运行模型。它提供了一个简单的命令行界面（CLI）以及一个用于与你的应用程序交互的REST API。
建议在MacOS上与Docker Desktop一起运行Ollama，以便Ollama为模型启用GPU加速。

对于Nvidia GPU，Ollama可以在Docker容器内通过GPU加速运行。

要开始使用Docker镜像，请使用以下命令。

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

现在你可以在容器内运行像Llama 2这样的模型。

docker exec -it ollama ollama run llama2

更多模型可以在Ollama库中找到。

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

李建忠：智能体正将互联网从信息网络重构为行动网络

探秘 DeepSeek 落地进展，腾讯云携手业界专家共话 AI 生产力

腾讯云TVP AI与安全高峰论坛圆满落幕，共探大模型时代的安全破局之道

查看更多评论

已为社区贡献3条内容