vllm server返回404的一种可能得解决方案

这里是我的测试脚本，你看看你的请求头里的模型名字/路径改对了吗。启动server的时候写的是相对路径，这里写成绝对路径了。我的 server 启动指令。就很奇怪，不都是直接访问。哦，原来是模型路径填错了。

氵文大师

972人浏览 · 2025-05-27 16:30:45

氵文大师 · 2025-05-27 16:30:45 发布

我的 server 启动指令

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7  PYTHONPATH=${PYTHONPATH}:/root/experiments/vllm vllm serve ./models/DeepSeek-V3-awq --tensor-parallel-size 8 --trust-remote-code  --disable-log-requests --load-format dummy --port 8040

client 端访访问后，server端返回：
在这里插入图片描述
就很奇怪，不都是直接访问 /v1/completions 这个路径吗？咋能404呢？

哦，原来是模型路径填错了

python benchmark_client.py \
  --backend vllm \
  --num_prompts 3000 \
  --warmup_round 1 \
  --concurrency 256 \
  --host localhost \
  --port 8000 \
  --model_name /test/models/DeepSeek-V3-awq      # <---------

启动server的时候写的是相对路径，这里写成绝对路径了
benchmark_client.py 这里是我的测试脚本，你看看你的请求头里的模型名字/路径改对了吗

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git