保姆级教程:本地部署 Ollama 模型 + Claude Code + Trae 插件,0 Token 免费 AI 编程

本文基于你真实可用的配置,严格贴合你踩坑验证后的最终方案,不写无效参数、不踩 /v1 坑,可直接复制到博客使用。


一、前言

市面上 AI 编程工具大多按月付费或按 Token 计费,对学生和个人开发者很不友好。
借助 Ollama 本地运行开源大模型(gemma4:e4b / qwen2:7b / deepseek-r1:7b),搭配 Claude Code 官方编程助手,再集成到 Trae 编辑器插件,即可实现:

  • 完全本地运行,不上传代码
  • 0 Token、0 费用、无 API Key
  • 隐私安全,断网可用
  • 支持多模型自由切换

二、Ollama 安装与本地模型部署

2.1 安装 Ollama

# Linux / macOS 一键安装
curl -fsSL https://ollama.com/install.sh | sh

Windows 直接下载安装包:https://ollama.com/download

安装后验证:

ollama --version

2.2 拉取你本地已有的模型

# 你本地最强模型(优先用)
ollama pull gemma4:e4b

# 备选模型
ollama pull qwen2:7b
ollama pull deepseek-r1:7b

查看已安装模型:

ollama list

2.3 启动 Ollama 服务(关键)

Ollama 默认端口 11434,一个端口支持所有模型同时调度,无需为每个模型开端口。

# 启动服务
ollama serve

# 若提示端口已占用,说明服务已在后台运行,直接下一步

测试服务是否正常:

curl http://localhost:11434/api/tags

返回模型列表即正常。


三、Claude Code 安装与对接本地 Ollama

3.1 安装 Claude Code

依赖 Node.js >= 18:

# 安装 Node.js(省略)
# 全局安装 Claude Code
npm install -g @anthropic-ai/claude-code

验证:

claude --version

3.2 核心配置(你实测可用版)

创建配置文件(无需 /v1,这是你踩坑后验证的正确写法):

mkdir -p ~/.claude
nano ~/.claude/settings.json

填入以下配置(直接复制):

{
  "env": {
    "ANTHROPIC_BASE_URL": "http://localhost:11434",
    "ANTHROPIC_AUTH_TOKEN": "ollama",
    "ANTHROPIC_MODEL": "gemma4:e4b",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
  }
}
  • ANTHROPIC_BASE_URL不要加 /v1
  • ANTHROPIC_MODEL:必须与 ollama list 完全一致
  • 最后一项禁用数据上报,纯本地使用

3.3 启动 Claude Code 终端版

claude

直接提问测试:

你是谁?用C++写一个线程安全单例

四、Trae 中安装并启动 Claude Code 插件

4.1 安装 Trae 插件

打开 VS Code / JetBrains IDE
插件市场搜索:

Trae

安装并简单登录(仅插件激活,不影响本地模型)

4.2 在 Trae 中安装 Claude Code 插件

进入 Trae → 扩展商城
搜索:

Claude Code

安装 Anthropic 官方插件

4.3 Trae 内配置本地模型(关键)

在 Trae 设置中配置:

Base URL:      http://localhost:11434
API Key:       ollama
Model:         gemma4:e4b

依旧不要加 /v1

4.4 启动插件

快捷键唤起:

  • Linux/Win:Ctrl + Esc
  • Mac:Cmd + Esc

唤起后即可在编辑器内直接对话、写代码、查 Bug。


五、完整调用示例(可直接贴博客演示)

示例 1:终端 curl 调用本地模型

curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
  "model": "gemma4:e4b",
  "messages": [
    {"role": "user", "content": "写一个Python快速排序"}
  ]
}'

示例 2:Claude Code 终端调用

claude
> 帮我解释这段代码的内存泄漏并修复
> (粘贴你的代码)

示例 3:Trae 插件内调用

打开 Claude Code 面板,输入:

帮我把这段Python代码重构为异步版本

模型全程本地运行,不出电脑。


六、你遇到的关键坑(必须写进博客)

  1. Ollama 对接 Claude Code 不要加 /v1
    /v1 会变成 .../v1/v1/ 路径错误,直接报错模型不存在。

  2. 11434 是服务端口,不是模型端口
    一个端口支持所有模型,通过 model 名称区分,无需开多个端口。

  3. 模型名必须严格与 ollama list 一致
    你本地是 gemma4:e4b,不能写 gemma4:26b,否则直接找不到。

  4. ollama serve 提示端口占用 = 服务已启动
    不用重复启动,直接用 Claude 即可。


七、总结

这套方案 = Ollama(本地模型)+ Claude Code(官方编程助手)+ Trae(编辑器插件)

  • 免费、离线、隐私、无限制
  • 支持 gemma4、qwen2、deepseek 等任意开源模型
  • 配置一次,永久使用,不产生任何费用
  • 适合学习、个人项目、隐私代码开发

如果你需要,我可以再帮你生成一份博客封面标题 + 目录 + 文末引流句,直接发布即可。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐