Claude Code 省 token 的几个习惯

· 1 min read
AI Claude Code

用了几个月 Claude Code,摸出来一些省额度的门道,分享一下。

别老开新对话

每次新 session 启动,光系统提示词就要全价算一遍,大概 20K tokens 没了。接着上一个 session 聊,前面的内容都走缓存,只收十分之一的价。

别放太久不理它

缓存有保质期,普通用户 5 分钟,Pro/Max 用户 1 小时。超时了缓存就没了,下一句话又是全价。中间去开个会、刷半小时手机回来,钱就白花了。

干活的时候别动 CLAUDE.md

改一个字,后面的缓存链就断了,想整理就收工以后再弄。

别来回切模型

Opus 和 Sonnet 的计算结果不能互用,切一次上下文全部作废。

道理就一个

缓存认的是前缀,前面不变后面才便宜。开新对话、超时、改配置、切模型,都是在破坏前缀。

多聊少开,及时回复,少改少切。