OpenClaw 内置 Token 用量面板:Agent 产品终于开始算账了

OpenClaw 内置 Token 用量面板:Agent 产品终于开始算账了

OpenClaw 2026.2.6 加了一个 Token 用量面板。听上去是个小功能,但它暴露出一个行业级问题:大部分 AI Agent 产品到今天为止,仍然没有内置的用量可观测能力。

用户发现自己一天花了 300 美元 API 费用,是上了 HN 才知道的。不是产品告诉他的。

没有面板的时候大家怎么算账

之前的做法通常是去各家供应商后台看。Anthropic Console 看 Claude 用了多少,OpenAI Dashboard 看 GPT 用了多少。如果你还接了 xAI、Voyage、本地 Ollama,那就是四五个后台来回切。

问题在于:你知道"总共花了多少",但你不知道"花在哪了"。

一个 OpenClaw 用户可能同时跑着这些东西:Telegram 频道的问答、每小时一次的邮件摘要 Cron 任务、两个子 Agent 分别做代码审查和文件整理。供应商后台只给你一个总数。你不知道是 Cron 任务在烧钱,还是子 Agent 在跑飞。

2026.2.6 的面板做了什么

从 CHANGELOG 看,这次的 token usage dashboard 在 Web UI 里。具体能拆到什么维度,release notes 没有详细说明。但从同版本的其他改动可以推断一些东西:

这个版本同时加了 sessions_history 的 payload 裁剪(#10000),目的是减少上下文溢出。这说明会话历史的 token 统计数据已经在内部流转了,面板应该能按会话维度展示用量。

另外 2026.2.2 加了 Agents Dashboard,可以管理 Agent 文件、工具、技能、模型、频道和 Cron 任务。把这两个功能放在一起看,"按 Agent + 按任务拆账"的能力应该是基本具备了。

为什么这件事很重要

Agent 产品和传统 API 调用有一个本质区别:调用链路很深,而且不可预测。

传统 API 调用,你写一段代码调一次模型,Token 消耗是确定的。Agent 系统里,一次用户指令可能触发这样的链路:

用户消息 → 主 Agent 思考 → 调用 exec 工具 → 子 Agent 分析输出 
→ 子 Agent 调用 web_search → 主 Agent 汇总 → 回复用户

这条链上每个节点都在消耗 Token。如果主 Agent 用的是 Opus 4.6(输出 $75/百万 Token),子 Agent 用的也是同一个模型,一条链下来可能就是几美元。

HN 上有个用户说他设了一个天气提醒,每 4 小时触发一次。Agent 没有现成的天气 API 技能,于是每次都"从头发明宇宙"——写代码、发 HTTP 请求、解析结果。简单的天气查询,被 Agent 变成了一次完整的编程任务。一天下来烧掉的 Token 比用户手动写脚本贵了几百倍。

没有用量面板,这类问题只有在月底收到账单时才会发现。

Agent 场景下的"算账"应该长什么样

一个够用的 Token 用量面板,至少要做到三个维度:

按会话拆分。每个会话(session)消耗了多少 Token,包括输入、输出、思考 Token 分别多少。这是最基础的。

按 Agent/子 Agent 拆分。主 Agent 花了多少,每个子 Agent 花了多少。如果一个子 Agent 的消耗异常高,说明它的任务设计有问题,或者它在循环重试。

按工具调用拆分。exec 工具调了多少次,web_search 调了多少次,每次调用前后的 Token 消耗是多少。这个维度能帮你发现"Agent 在反复调同一个工具但拿不到想要的结果"这种隐性浪费。

更进一步,还可以加时间序列图:过去 24 小时的 Token 消耗曲线,精确到小时。Cron 任务的消耗会在固定时间点出现尖峰,一看就知道是哪个定时任务在烧钱。

实际操作:怎么在 OpenClaw 里看到用量

如果你已经在跑 OpenClaw 2026.2.6,Token 用量面板在 Web UI 的 Control Panel 里。具体路径:

  1. 确认你跑的版本是 2026.2.6 或更新(openclaw --version
  2. 启动 Gateway(openclaw gateway start
  3. 打开 Control UI(默认 http://localhost:4147
  4. 导航到 Token Usage / Dashboard 页面

如果你用的还是老版本,npm update -g openclaw 升级。

光有面板不够,还需要告警

面板解决了"事后看"的问题,但更有用的是"事中拦"。几个值得加的告警规则:

单次会话 Token 上限告警。如果一个会话的累计 Token 超过阈值(比如 100K),发通知。这通常意味着 Agent 陷入了循环,或者上下文膨胀失控。

日 Token 总量告警。设一个日预算,超过 80% 发预警,超过 100% 直接暂停非关键任务。

单次工具调用耗时告警。如果一次 exec 或 web_search 的 Token 消耗异常高(比如超过 10K),说明 Agent 可能在用大模型做本该用脚本做的事。

OpenClaw 目前的告警能力有限。如果你需要更完善的告警,可以从 Gateway 的日志里提取 Token 数据,导入 Prometheus + Grafana 做自定义面板和告警规则。

另一个思路:模型路由降成本

Token 面板让你知道"钱花在哪了",下一步是"少花钱"。

OpenClaw 2026.2.6 新增了 Opus 4.6 和 gpt-5.3-codex 的支持,同时也支持 xAI Grok。不同模型的价格差异巨大——Opus 4.6 的输出价格是某些小模型的 50 倍以上。

如果你的 OpenClaw 实例同时处理简单问答和复杂任务,可以在 Agent 配置里给不同场景指定不同模型。简单查询走便宜模型,复杂推理走 Opus。这个配置在 agents.list 里的 models 字段。

结合 Token 面板的数据,你可以量化地评估:把某类任务从 Opus 切到小模型后,Token 消耗降了多少,任务成功率变了多少。有数据支撑的决策,比拍脑袋靠谱。


参考链接

  • OpenClaw v2026.2.6 Release Notes:https://github.com/openclaw/openclaw/releases/tag/v2026.2.6
  • HN 用户关于 Token 消耗的讨论:https://news.ycombinator.com/item?id=46760237
  • OpenClaw Token Usage PR #10072:https://github.com/openclaw/openclaw/pull/10072
← 返回博客列表