Claude Code 省 token 的几个习惯
· 1 min read
AI Claude Code
用了几个月 Claude Code,摸出来一些省额度的门道,分享一下。
别老开新对话
每次新 session 启动,光系统提示词就要全价算一遍,大概 20K tokens 没了。接着上一个 session 聊,前面的内容都走缓存,只收十分之一的价。
别放太久不理它
缓存有保质期,普通用户 5 分钟,Pro/Max 用户 1 小时。超时了缓存就没了,下一句话又是全价。中间去开个会、刷半小时手机回来,钱就白花了。
干活的时候别动 CLAUDE.md
改一个字,后面的缓存链就断了,想整理就收工以后再弄。
别来回切模型
Opus 和 Sonnet 的计算结果不能互用,切一次上下文全部作废。
道理就一个
缓存认的是前缀,前面不变后面才便宜。开新对话、超时、改配置、切模型,都是在破坏前缀。
多聊少开,及时回复,少改少切。