模型配置
Claude Code 背后能挂不同模型,就像一台车能换挡——日常用 Sonnet 省油,爬陡坡换 Opus,跑短途切 Haiku。这一页讲清楚有哪些模型、怎么换挡、怎么调思考深度。
Claude Code 当前提供三档模型,对应三档能力与价格。
| 模型 | 版本 | 擅长 | 成本 |
|---|---|---|---|
| Sonnet | 最新 Sonnet 4.5 | 日常编码、改 Bug、写测试 | 中 |
| Opus | Opus 4.1 | 复杂推理、架构设计、长链路分析 | 高 |
| Haiku | Haiku | 快速简单任务、分类、补全 | 低 |
经验之谈:90% 的日常用 Sonnet 就够。复杂重构、跨文件大改、需要深度推理时切 Opus。Haiku 适合跑批量小任务(如给一堆文件加注释)。
模型别名(换挡杆)
Section titled “模型别名(换挡杆)”不用记完整模型名,用别名就行。Claude Code 内置 6 个别名,覆盖所有组合。
| 别名 | 含义 |
|---|---|
default |
按账号类型自动选最合适的(推荐起步用) |
sonnet |
最新 Sonnet(当前 4.5) |
opus |
最新 Opus(当前 4.1) |
haiku |
最新 Haiku |
sonnet[1m] |
Sonnet + 100 万 token 上下文 |
opusplan |
Plan 阶段用 Opus,执行用 Sonnet |
opusplan:双脑模式
Section titled “opusplan:双脑模式”opusplan 是个特殊存在。它不是单一模型,而是一个组合策略:
规划阶段(Plan)→ 用 Opus 想清楚做什�的、怎么拆执行阶段(Act) → 切回 Sonnet 干活适合那种「想得清楚但写得多」的任务:架构重构、跨模块改造。Opus 把方案想透,Sonnet 把代码堆完,省下 Opus 的昂贵推理预算用在刀刃上。
sonnet[1m]:百万上下文
Section titled “sonnet[1m]:百万上下文”sonnet[1m] 把上下文窗口从 200K 拉到 100 万 token,相当于能塞进整个中大型项目的全部源码。
200K → 装一个模块1M → 装整个仓库限制:100 万上下文仅对 Console/API 用户开放,普通订阅可能用不了。
四种方式,按场景选。
| 方式 | 命令 | 场景 |
|---|---|---|
| 会话中切换 | /model opus |
临时换挡,最常用 |
| 启动时指定 | claude --model opus |
一开始就定 |
| 环境变量 | export ANTHROPIC_MODEL=opus |
全局默认 |
| 配置文件 | settings.json 里设 model |
项目级固化 |
# 启动用 Opus 跑深度审查claude --model opus --effort high
# 会话中切到 Sonnet 省成本/model sonnet
# 全局默认 Opusexport ANTHROPIC_MODEL=opus检查当前模型
Section titled “检查当前模型”不确定现在用的哪个?两种方式查:
/status:显示版本、当前模型、账号、配额。- 状态栏:交互界面底部一直显示当前别名和 effort 级别。
/status→ Claude Code v1.x.x Model: sonnet (Sonnet 4.5) Effort: medium Account: ...effort:思考强度
Section titled “effort:思考强度”effort 控制 Claude「想多深再开口」,像思考时间的旋钮。5 档,越往后越费 token 但越深思。
| 级别 | 含义 | 适合 |
|---|---|---|
low |
快速回答 | 简单问答、补全 |
medium |
默认 | 日常编码 |
high |
深度思考 | 复杂 Bug、设计 |
xhigh |
极深思考 | 架构决策、长链路推理 |
max |
顶格思考 | 最难的问题,烧 token 换质量 |
# 遇到棘手 Bug,开 max 思考claude --model opus --effort max
# 简单任务用 low 省钱claude --model haiku --effort low -p "给这个函数加注释"心法:effort 和模型是两个独立旋钮。Opus + low 不一定比 Sonnet + high 好——难题给够思考时间,比换更贵的脑子更有效。
一组环境变量让你精细控制模型选择与行为。
| 变量 | 作用 |
|---|---|
ANTHROPIC_MODEL |
默认模型别名 |
ANTHROPIC_DEFAULT_OPUS_MODEL |
别名 opus 实际指向哪个具体模型 |
ANTHROPIC_DEFAULT_SONNET_MODEL |
别名 sonnet 实际指向哪个具体模型 |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
别名 haiku 实际指向哪个具体模型 |
CLAUDE_CODE_SUBAGENT_MODEL |
Subagent 子代理用的模型(默认用 Haiku 省 token) |
DISABLE_PROMPT_CACHING |
禁用 prompt caching(默认开启,能省钱;特殊调试时关掉) |
# 把别名 opus 指向一个具体的模型版本export ANTHROPIC_DEFAULT_OPUS_MODEL="claude-opus-4-1-20250805"
# 子代理用 Sonnet 而不是默认的 Haikuexport CLAUDE_CODE_SUBAGENT_MODEL=sonnetPrompt Caching
Section titled “Prompt Caching”默认开启的 Prompt Caching 能把重复的 system prompt、CLAUDE.md、上下文缓存起来,大幅降本(缓存命中约 1/10 价格)。除非在调试 prompt 行为,否则别关。
# 一般不要关# export DISABLE_PROMPT_CACHING=1 ← 除非调试模型是脑子,effort 是思考时间,opusplan 是双脑接力,sonnet[1m] 是大胃王。日常
sonnet+medium起步,难题切opus+max,省钱用haiku——三个旋钮组合出你能想到的所有档位。
继续看 输入输出格式 了解自动化场景怎么和 Claude 对接。🧠