OpenClaw 内置 Token 用量面板：Agent 产品终于开始算账了

OpenClaw 2026.2.6 加了一个 Token 用量面板。听上去是个小功能，但它暴露出一个行业级问题：大部分 AI Agent 产品到今天为止，仍然没有内置的用量可观测能力。

用户发现自己一天花了 300 美元 API 费用，是上了 HN 才知道的。不是产品告诉他的。

没有面板的时候大家怎么算账

之前的做法通常是去各家供应商后台看。Anthropic Console 看 Claude 用了多少，OpenAI Dashboard 看 GPT 用了多少。如果你还接了 xAI、Voyage、本地 Ollama，那就是四五个后台来回切。

问题在于：你知道"总共花了多少"，但你不知道"花在哪了"。

一个 OpenClaw 用户可能同时跑着这些东西：Telegram 频道的问答、每小时一次的邮件摘要 Cron 任务、两个子 Agent 分别做代码审查和文件整理。供应商后台只给你一个总数。你不知道是 Cron 任务在烧钱，还是子 Agent 在跑飞。

从 CHANGELOG 看，这次的 token usage dashboard 在 Web UI 里。具体能拆到什么维度，release notes 没有详细说明。但从同版本的其他改动可以推断一些东西：

这个版本同时加了 sessions_history 的 payload 裁剪（#10000），目的是减少上下文溢出。这说明会话历史的 token 统计数据已经在内部流转了，面板应该能按会话维度展示用量。

另外 2026.2.2 加了 Agents Dashboard，可以管理 Agent 文件、工具、技能、模型、频道和 Cron 任务。把这两个功能放在一起看，"按 Agent + 按任务拆账"的能力应该是基本具备了。

Agent 产品和传统 API 调用有一个本质区别：调用链路很深，而且不可预测。

传统 API 调用，你写一段代码调一次模型，Token 消耗是确定的。Agent 系统里，一次用户指令可能触发这样的链路：

用户消息 → 主 Agent 思考 → 调用 exec 工具 → 子 Agent 分析输出 
→ 子 Agent 调用 web_search → 主 Agent 汇总 → 回复用户

这条链上每个节点都在消耗 Token。如果主 Agent 用的是 Opus 4.6（输出 $75/百万 Token），子 Agent 用的也是同一个模型，一条链下来可能就是几美元。

HN 上有个用户说他设了一个天气提醒，每 4 小时触发一次。Agent 没有现成的天气 API 技能，于是每次都"从头发明宇宙"——写代码、发 HTTP 请求、解析结果。简单的天气查询，被 Agent 变成了一次完整的编程任务。一天下来烧掉的 Token 比用户手动写脚本贵了几百倍。

没有用量面板，这类问题只有在月底收到账单时才会发现。

一个够用的 Token 用量面板，至少要做到三个维度：

按会话拆分。每个会话（session）消耗了多少 Token，包括输入、输出、思考 Token 分别多少。这是最基础的。

按 Agent/子 Agent 拆分。主 Agent 花了多少，每个子 Agent 花了多少。如果一个子 Agent 的消耗异常高，说明它的任务设计有问题，或者它在循环重试。

按工具调用拆分。exec 工具调了多少次，web_search 调了多少次，每次调用前后的 Token 消耗是多少。这个维度能帮你发现"Agent 在反复调同一个工具但拿不到想要的结果"这种隐性浪费。

更进一步，还可以加时间序列图：过去 24 小时的 Token 消耗曲线，精确到小时。Cron 任务的消耗会在固定时间点出现尖峰，一看就知道是哪个定时任务在烧钱。

如果你已经在跑 OpenClaw 2026.2.6，Token 用量面板在 Web UI 的 Control Panel 里。具体路径：

如果你用的还是老版本，npm update -g openclaw 升级。

面板解决了"事后看"的问题，但更有用的是"事中拦"。几个值得加的告警规则：

单次会话 Token 上限告警。如果一个会话的累计 Token 超过阈值（比如 100K），发通知。这通常意味着 Agent 陷入了循环，或者上下文膨胀失控。

日 Token 总量告警。设一个日预算，超过 80% 发预警，超过 100% 直接暂停非关键任务。

单次工具调用耗时告警。如果一次 exec 或 web_search 的 Token 消耗异常高（比如超过 10K），说明 Agent 可能在用大模型做本该用脚本做的事。

OpenClaw 目前的告警能力有限。如果你需要更完善的告警，可以从 Gateway 的日志里提取 Token 数据，导入 Prometheus + Grafana 做自定义面板和告警规则。

Token 面板让你知道"钱花在哪了"，下一步是"少花钱"。

OpenClaw 2026.2.6 新增了 Opus 4.6 和 gpt-5.3-codex 的支持，同时也支持 xAI Grok。不同模型的价格差异巨大——Opus 4.6 的输出价格是某些小模型的 50 倍以上。

如果你的 OpenClaw 实例同时处理简单问答和复杂任务，可以在 Agent 配置里给不同场景指定不同模型。简单查询走便宜模型，复杂推理走 Opus。这个配置在 agents.list 里的 models 字段。

结合 Token 面板的数据，你可以量化地评估：把某类任务从 Opus 切到小模型后，Token 消耗降了多少，任务成功率变了多少。有数据支撑的决策，比拍脑袋靠谱。

参考链接

OpenClaw v2026.2.6 Release Notes：https://github.com/openclaw/openclaw/releases/tag/v2026.2.6
HN 用户关于 Token 消耗的讨论：https://news.ycombinator.com/item?id=46760237
OpenClaw Token Usage PR #10072：https://github.com/openclaw/openclaw/pull/10072