OpenClaw 内置 Token 用量面板:Agent 产品终于开始算账了
OpenClaw 2026.2.6 加了一个 Token 用量面板。听上去是个小功能,但它暴露出一个行业级问题:大部分 AI Agent 产品到今天为止,仍然没有内置的用量可观测能力。
用户发现自己一天花了 300 美元 API 费用,是上了 HN 才知道的。不是产品告诉他的。
没有面板的时候大家怎么算账
之前的做法通常是去各家供应商后台看。Anthropic Console 看 Claude 用了多少,OpenAI Dashboard 看 GPT 用了多少。如果你还接了 xAI、Voyage、本地 Ollama,那就是四五个后台来回切。
问题在于:你知道"总共花了多少",但你不知道"花在哪了"。
一个 OpenClaw 用户可能同时跑着这些东西:Telegram 频道的问答、每小时一次的邮件摘要 Cron 任务、两个子 Agent 分别做代码审查和文件整理。供应商后台只给你一个总数。你不知道是 Cron 任务在烧钱,还是子 Agent 在跑飞。
2026.2.6 的面板做了什么
从 CHANGELOG 看,这次的 token usage dashboard 在 Web UI 里。具体能拆到什么维度,release notes 没有详细说明。但从同版本的其他改动可以推断一些东西:
这个版本同时加了 sessions_history 的 payload 裁剪(#10000),目的是减少上下文溢出。这说明会话历史的 token 统计数据已经在内部流转了,面板应该能按会话维度展示用量。
另外 2026.2.2 加了 Agents Dashboard,可以管理 Agent 文件、工具、技能、模型、频道和 Cron 任务。把这两个功能放在一起看,"按 Agent + 按任务拆账"的能力应该是基本具备了。
为什么这件事很重要
Agent 产品和传统 API 调用有一个本质区别:调用链路很深,而且不可预测。
传统 API 调用,你写一段代码调一次模型,Token 消耗是确定的。Agent 系统里,一次用户指令可能触发这样的链路:
用户消息 → 主 Agent 思考 → 调用 exec 工具 → 子 Agent 分析输出
→ 子 Agent 调用 web_search → 主 Agent 汇总 → 回复用户
这条链上每个节点都在消耗 Token。如果主 Agent 用的是 Opus 4.6(输出 $75/百万 Token),子 Agent 用的也是同一个模型,一条链下来可能就是几美元。
HN 上有个用户说他设了一个天气提醒,每 4 小时触发一次。Agent 没有现成的天气 API 技能,于是每次都"从头发明宇宙"——写代码、发 HTTP 请求、解析结果。简单的天气查询,被 Agent 变成了一次完整的编程任务。一天下来烧掉的 Token 比用户手动写脚本贵了几百倍。
没有用量面板,这类问题只有在月底收到账单时才会发现。
Agent 场景下的"算账"应该长什么样
一个够用的 Token 用量面板,至少要做到三个维度:
按会话拆分。每个会话(session)消耗了多少 Token,包括输入、输出、思考 Token 分别多少。这是最基础的。
按 Agent/子 Agent 拆分。主 Agent 花了多少,每个子 Agent 花了多少。如果一个子 Agent 的消耗异常高,说明它的任务设计有问题,或者它在循环重试。
按工具调用拆分。exec 工具调了多少次,web_search 调了多少次,每次调用前后的 Token 消耗是多少。这个维度能帮你发现"Agent 在反复调同一个工具但拿不到想要的结果"这种隐性浪费。
更进一步,还可以加时间序列图:过去 24 小时的 Token 消耗曲线,精确到小时。Cron 任务的消耗会在固定时间点出现尖峰,一看就知道是哪个定时任务在烧钱。
实际操作:怎么在 OpenClaw 里看到用量
如果你已经在跑 OpenClaw 2026.2.6,Token 用量面板在 Web UI 的 Control Panel 里。具体路径:
- 确认你跑的版本是 2026.2.6 或更新(
openclaw --version) - 启动 Gateway(
openclaw gateway start) - 打开 Control UI(默认
http://localhost:4147) - 导航到 Token Usage / Dashboard 页面
如果你用的还是老版本,npm update -g openclaw 升级。
光有面板不够,还需要告警
面板解决了"事后看"的问题,但更有用的是"事中拦"。几个值得加的告警规则:
单次会话 Token 上限告警。如果一个会话的累计 Token 超过阈值(比如 100K),发通知。这通常意味着 Agent 陷入了循环,或者上下文膨胀失控。
日 Token 总量告警。设一个日预算,超过 80% 发预警,超过 100% 直接暂停非关键任务。
单次工具调用耗时告警。如果一次 exec 或 web_search 的 Token 消耗异常高(比如超过 10K),说明 Agent 可能在用大模型做本该用脚本做的事。
OpenClaw 目前的告警能力有限。如果你需要更完善的告警,可以从 Gateway 的日志里提取 Token 数据,导入 Prometheus + Grafana 做自定义面板和告警规则。
另一个思路:模型路由降成本
Token 面板让你知道"钱花在哪了",下一步是"少花钱"。
OpenClaw 2026.2.6 新增了 Opus 4.6 和 gpt-5.3-codex 的支持,同时也支持 xAI Grok。不同模型的价格差异巨大——Opus 4.6 的输出价格是某些小模型的 50 倍以上。
如果你的 OpenClaw 实例同时处理简单问答和复杂任务,可以在 Agent 配置里给不同场景指定不同模型。简单查询走便宜模型,复杂推理走 Opus。这个配置在 agents.list 里的 models 字段。
结合 Token 面板的数据,你可以量化地评估:把某类任务从 Opus 切到小模型后,Token 消耗降了多少,任务成功率变了多少。有数据支撑的决策,比拍脑袋靠谱。
参考链接
- OpenClaw v2026.2.6 Release Notes:
https://github.com/openclaw/openclaw/releases/tag/v2026.2.6 - HN 用户关于 Token 消耗的讨论:
https://news.ycombinator.com/item?id=46760237 - OpenClaw Token Usage PR #10072:
https://github.com/openclaw/openclaw/pull/10072