当部署大模型时候遇到如下报错

ValueError: Model architectures [''] failed to be inspected. Please check the logs for more details.

比如:

ValueError: Model architectures ['Qwen2ForCausalLM'] failed to be inspected. Please check the logs for more details.

这时候尝试卸载 flash-attn

pip uninstall flash-attn -y

本质上是因为某些版本的 vllm 已经内置了 flash-attn,新装的 flash-attn 与 vLLM 内置的 flash-attn 发生冲突。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐