claude code 安装以及调用本地大模型
市面上 AI 编程工具大多按月付费或按 Token 计费,对学生和个人开发者很不友好。借助Ollama本地运行开源大模型(gemma4:e4b / qwen2:7b / deepseek-r1:7b),搭配官方编程助手,再集成到Trae完全本地运行,不上传代码0 Token、0 费用、无 API Key隐私安全,断网可用支持多模型自由切换这套方案 =Ollama(本地模型)+ Claude Cod
保姆级教程:本地部署 Ollama 模型 + Claude Code + Trae 插件,0 Token 免费 AI 编程
本文基于你真实可用的配置,严格贴合你踩坑验证后的最终方案,不写无效参数、不踩 /v1 坑,可直接复制到博客使用。
一、前言
市面上 AI 编程工具大多按月付费或按 Token 计费,对学生和个人开发者很不友好。
借助 Ollama 本地运行开源大模型(gemma4:e4b / qwen2:7b / deepseek-r1:7b),搭配 Claude Code 官方编程助手,再集成到 Trae 编辑器插件,即可实现:
- 完全本地运行,不上传代码
- 0 Token、0 费用、无 API Key
- 隐私安全,断网可用
- 支持多模型自由切换
二、Ollama 安装与本地模型部署
2.1 安装 Ollama
# Linux / macOS 一键安装
curl -fsSL https://ollama.com/install.sh | sh
Windows 直接下载安装包:https://ollama.com/download
安装后验证:
ollama --version
2.2 拉取你本地已有的模型
# 你本地最强模型(优先用)
ollama pull gemma4:e4b
# 备选模型
ollama pull qwen2:7b
ollama pull deepseek-r1:7b
查看已安装模型:
ollama list
2.3 启动 Ollama 服务(关键)
Ollama 默认端口 11434,一个端口支持所有模型同时调度,无需为每个模型开端口。
# 启动服务
ollama serve
# 若提示端口已占用,说明服务已在后台运行,直接下一步
测试服务是否正常:
curl http://localhost:11434/api/tags
返回模型列表即正常。
三、Claude Code 安装与对接本地 Ollama
3.1 安装 Claude Code
依赖 Node.js >= 18:
# 安装 Node.js(省略)
# 全局安装 Claude Code
npm install -g @anthropic-ai/claude-code
验证:
claude --version
3.2 核心配置(你实测可用版)
创建配置文件(无需 /v1,这是你踩坑后验证的正确写法):
mkdir -p ~/.claude
nano ~/.claude/settings.json
填入以下配置(直接复制):
{
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:11434",
"ANTHROPIC_AUTH_TOKEN": "ollama",
"ANTHROPIC_MODEL": "gemma4:e4b",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
}
}
ANTHROPIC_BASE_URL:不要加 /v1ANTHROPIC_MODEL:必须与ollama list完全一致- 最后一项禁用数据上报,纯本地使用
3.3 启动 Claude Code 终端版
claude
直接提问测试:
你是谁?用C++写一个线程安全单例
四、Trae 中安装并启动 Claude Code 插件
4.1 安装 Trae 插件
打开 VS Code / JetBrains IDE
插件市场搜索:
Trae
安装并简单登录(仅插件激活,不影响本地模型)
4.2 在 Trae 中安装 Claude Code 插件
进入 Trae → 扩展商城
搜索:
Claude Code
安装 Anthropic 官方插件
4.3 Trae 内配置本地模型(关键)
在 Trae 设置中配置:
Base URL: http://localhost:11434
API Key: ollama
Model: gemma4:e4b
依旧不要加 /v1
4.4 启动插件
快捷键唤起:
- Linux/Win:
Ctrl + Esc - Mac:
Cmd + Esc
唤起后即可在编辑器内直接对话、写代码、查 Bug。
五、完整调用示例(可直接贴博客演示)
示例 1:终端 curl 调用本地模型
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "gemma4:e4b",
"messages": [
{"role": "user", "content": "写一个Python快速排序"}
]
}'
示例 2:Claude Code 终端调用
claude
> 帮我解释这段代码的内存泄漏并修复
> (粘贴你的代码)
示例 3:Trae 插件内调用
打开 Claude Code 面板,输入:
帮我把这段Python代码重构为异步版本
模型全程本地运行,不出电脑。
六、你遇到的关键坑(必须写进博客)
-
Ollama 对接 Claude Code 不要加 /v1
加/v1会变成.../v1/v1/路径错误,直接报错模型不存在。 -
11434 是服务端口,不是模型端口
一个端口支持所有模型,通过model名称区分,无需开多个端口。 -
模型名必须严格与
ollama list一致
你本地是gemma4:e4b,不能写gemma4:26b,否则直接找不到。 -
ollama serve 提示端口占用 = 服务已启动
不用重复启动,直接用 Claude 即可。
七、总结
这套方案 = Ollama(本地模型)+ Claude Code(官方编程助手)+ Trae(编辑器插件)
- 免费、离线、隐私、无限制
- 支持 gemma4、qwen2、deepseek 等任意开源模型
- 配置一次,永久使用,不产生任何费用
- 适合学习、个人项目、隐私代码开发
如果你需要,我可以再帮你生成一份博客封面标题 + 目录 + 文末引流句,直接发布即可。
更多推荐
所有评论(0)