我用 clawdbot 把重复劳动"剪掉"了：一周实战复盘

周一早上起来，发现周末积了 47 封未读邮件。花半小时分类：技术问题转给开发，商务咨询标记待回复，垃圾邮件删掉。分完类已经过了 9 点半，正事还没开始干。

每天都这样。整理邮件、更新进度表、催进度、汇总数据、写周报。这些事情不难，就是占时间。做完一天，真正"创造价值"的时间可能就两三个小时。

上周在社区里看到有人分享用 clawdbot 处理重复任务，我决定试试。一周后，那 47 封邮件的活儿变成了"早上看十分钟处理结果"。

记录一下这一周我用 clawdbot 做了什么，踩了哪些坑，值不值得。

为什么是 clawdbot

之前试过 Zapier 和 n8n。它们适合处理固定流程的事，比如"收到邮件就发通知"。但稍微复杂点就不行了。

拿邮件分类来说。传统自动化只能匹配关键词："主题里有'bug'就是技术问题，有'合作'就是商务咨询。"但客户描述问题五花八门，关键词匹配根本不靠谱。

clawdbot 不一样。官方文档提到它基于 Claude 这类大语言模型，能理解内容语义。不是简单匹配词，而是读懂邮件在说什么。还能直接调 API 或操作浏览器，覆盖的场景更广。

而且它开源，可以在本地跑。我数据敏感，不想把客户信息传给第三方平台。

第一天：邮件自动分类

我的第一个目标很简单：让它帮我把邮件分类。

我每天收的邮件大概分四类：

技术问题（客户报 bug 或者问功能）
商务咨询（问价格、合作、试用）
日常通知（系统邮件、订阅内容）
垃圾邮件

手动分类每天要花 20-30 分钟。我想让 clawdbot 帮我做。

设置任务：

每小时扫描邮箱，把新邮件按内容分成四类，打标签。技术问题发通知到 Slack 并@技术负责人，商务咨询标记"待回复"并生成一句话摘要。

第一次跑，分类准确率大概 70%。有些邮件被误判了。比如客户说"想了解一下你们的技术方案"，被分到技术问题，其实这是商务咨询。

我调整了任务描述，增加了判断逻辑：

商务咨询：询问价格、合作、试用、采购、技术方案介绍。技术问题：报错、功能不工作、使用困惑、API 调用失败。

调整后准确率到了 85% 左右。边界情况还是会出错，但已经能用。我每天早上检查一遍分类结果，发现错误手动调整，顺便优化任务描述。

第一天成果： 邮件分类从每天 30 分钟降到 5 分钟检查 + 偶尔调整。

第二天：自动生成周报初稿

每周五要写周报，汇总本周工作。之前的流程是：

翻看本周的 Slack 消息，找关键事件
查看项目管理工具，看完成了哪些任务
回顾邮件，看处理了哪些客户问题
整理成周报，发给老板

这套流程每次要 1-2 小时。

我让 clawdbot 帮我做前三步：

每周五下午 4 点，检索本周 Slack 消息、项目管理工具的任务完成记录、客户邮件处理记录。按"技术开发、客户支持、商务对接"分类，生成周报初稿。

跑出来的结果是一份结构化的清单。它把本周所有操作都列出来了，太详细。"周一 10:15 回复了客户 A 的邮件，询问 API 调用问题"，这种流水账没人想看。

我修改任务：

每周五下午 4 点，检索本周 Slack 消息、项目管理工具的任务完成记录、客户邮件处理记录。提取关键事件（项目里程碑、重大 bug 修复、重要客户对接）,按"技术开发、客户支持、商务对接"分类，每条用一句话概括。

改完后生成的初稿简洁多了。只需要微调语气、补充细节，10 分钟完成周报。

第二天成果： 周报从 1-2 小时降到 10-15 分钟。

第三天：自动催进度

我负责几个外包项目。每周要问外包团队进度，他们回复后我要更新到项目管理工具。

之前流程：

周三上午给每个外包团队发邮件："本周进度如何？"
他们回复（有的当天回，有的拖到周五）
我把回复内容手动复制到项目管理工具，更新状态

很机械，但不做不行。

我让 clawdbot 自动催：

每周三上午 9 点，给"外包团队列表"里的每个团队发邮件，询问本周进度。收到回复后，提取关键信息（完成了什么、遇到什么问题、下周计划），更新到项目管理工具的对应项目。

这里踩了个坑。第一次跑的时候，它给所有外包团队发了同一封邮件，内容太生硬："请汇报本周进度。" 外包团队回复说"这邮件是机器人发的吗？"

不能让它看起来太机器人。我调整了邮件模板：

邮件内容要带上项目名称和上周的进度作为上下文，语气要自然。比如"Hi [团队名]，上周你们提到在做 [功能]，这周进展如何？有没有遇到阻碍？"

改完后外包团队回复率明显高了，回复内容也更详细。clawdbot 提取关键信息的准确率不错，每周检查一遍更新结果就行。

第三天成果： 催进度和更新项目状态从每周 1 小时降到 10 分钟检查。

第四天：数据汇总和简报

每天下午 5 点，老板要看当天的数据简报：新增用户数、活跃用户数、新增订单、客户反馈数量。

我之前的做法是手动登录各个后台，复制数字，粘贴到 Excel，然后截图发给老板。每天 15 分钟。

这事完全可以自动化。我让 clawdbot 做：

每天下午 4:50，访问后台系统，提取今日新增用户、活跃用户、新增订单、客户反馈数量。生成一张简洁的表格，发到 Slack 的"每日数据"频道并@老板。

第一次跑失败了。后台系统需要登录，clawdbot 卡在登录页面。

翻文档发现可以给它配置浏览器的 session。我手动登录一次，把 session 保存下来，让 clawdbot 用这个 session 访问。

第二次跑成功了，但数据不对。它提取的"新增用户数"是总用户数。检查后发现，后台的"今日新增"和"总数"显示在同一个页面，它搞混了。

调整任务，明确告诉它"提取标签为'今日新增'的数字，不是'总计'下面的数字"。第三次跑，数据对了。连续跑了三天，每天核对数字，没发现错误。

第四天成果： 数据汇总从每天 15 分钟降到 0 分钟（全自动）。

第五天：客户问题自动回复（部分）

客户经常问一些重复的问题：

怎么重置密码？
API 调用限制是多少？
数据存储在哪里？

这些问题我们文档里都有，但客户懒得看文档，直接发邮件问。每天要回复 5-10 封这种邮件。

我让 clawdbot 做：

收到客户邮件，判断是否是常见问题（参考知识库）。如果是，生成回复草稿（引用文档链接 + 一句话解释），发给我审核。我确认后发送。

这里我留了人工审核环节。对外回复不能出错，万一它理解错了客户的问题，回复不对就麻烦了。

跑了一天，它识别出 8 封常见问题邮件，生成了回复草稿。检查后发现，有 1 封理解错了（客户问"API 限制"，它理解成"API 报错"），其他 7 封都对。

修改那 1 封后发送，其他的直接发送。原本要自己写 8 封回复，现在变成"检查 8 封草稿 + 修改 1 封"。时间从 30 分钟降到 10 分钟。

第五天成果： 常见问题回复时间降到原来 1/3。

第六天：处理数据导出请求

我们有个客户每周五要导出一份数据报表。流程很固定：

登录后台
选择时间范围（本周一到周五）
选择数据类型（用户行为日志）
导出 CSV
发邮件给客户

每次 10 分钟，但每周都要做。

我让 clawdbot 自动跑：

每周五下午 3 点，登录后台，选择"本周一到周五"的用户行为日志，导出 CSV，发邮件给客户 X。

第一次跑的时候，它把上周的数据导出了。发现它在选择时间范围时选错了。

检查后发现，后台的日期选择器是个日历控件，需要点两次（选开始日期和结束日期）。clawdbot 第一次没点对。

把任务描述改得更详细：

点击"开始日期"，选择本周一的日期；点击"结束日期"，选择本周五的日期。确认日期范围显示为"YYYY-MM-DD 至 YYYY-MM-DD"后再点击导出。

改完之后跑通了。

第六天成果： 数据导出任务完全自动化，每周省 10 分钟。

一周下来省了多少时间

到周末统计了一下：

任务	之前耗时	现在耗时	节省
邮件分类	每天 30 分钟	每天 5 分钟	每天 25 分钟
周报生成	每周 1-2 小时	每周 10 分钟	每周 1 小时
催进度	每周 1 小时	每周 10 分钟	每周 50 分钟
数据汇总	每天 15 分钟	0 分钟	每天 15 分钟
常见问题回复	每天 30 分钟	每天 10 分钟	每天 20 分钟
数据导出	每周 10 分钟	0 分钟	每周 10 分钟

每周省出来的时间大概 7-8 小时。

踩的坑

这一周不是一帆风顺，总结几个坑：

浏览器操作不稳定

clawdbot 操作浏览器时，页面加载慢或者元素位置变了，可能会点错。解决办法是尽量用 API。邮件、Slack、项目管理工具都有 API，直接调 API 比浏览器操作快、稳定、便宜。只有后台系统没 API 才用浏览器。

语义理解有边界

它能理解大部分邮件内容，但碰到特别口语化或者专业术语多的邮件会理解错。没办法完全解决，只能留人工审核环节。对外回复、写入操作，都保留了"生成草稿→人工检查→执行"的流程。

权限和安全

给 clawdbot 配置各种工具的 API key 和登录凭证时要小心。我专门创建了一个"bot 专用账号"，权限设得很低（只能读邮件、发消息，不能删数据、改配置）。

Token 消耗

前两天让它做太多浏览器操作，token 烧得很快。后来改成 API 调用，成本降了一大半。现在的原则是：能用 API 就用 API，用不了再考虑浏览器。

任务描述需要迭代

第一次写任务描述基本不会一次成功。要测试、发现问题、调整描述，反复几次才能跑稳。邮件分类任务改了三次描述才达到 85% 准确率，催进度的邮件模板也是改了两次才自然。

成本核算

用了一周 clawdbot，花了多少钱？

我主要用的是 Claude Sonnet API。根据社区里的经验，输出 token 是 $15/百万。粗算一下这一周的消耗：

邮件分类：每天 50 封，每次 500 tokens = 2.5 万 tokens/天
周报生成：每次 5000 tokens，每周 1 次
催进度：每周 5 封邮件，每封 500 tokens = 2500 tokens/周
数据汇总：用浏览器操作，token 消耗大，每次 3000 tokens = 2.1 万 tokens/天
常见问题回复：每天 8 封，每次 800 tokens = 6400 tokens/天
数据导出：每次 3000 tokens，每周 1 次

每天 5 万 tokens 左右，一周下来 35 万 tokens。按 $15/百万算，花了 $5-6。

一周省 8 小时，花 $5。值。

省时间只是表面收益

用了一周，发现一件事：clawdbot 最大的价值不是省时间。

之前每天花 1-2 小时处理邮件、整理数据、催进度，做完这些事人已经累了，不想动脑子了。剩下的时间就是应付式地干活。

现在这些机械活儿不用我做了。早上上班，邮件已经分好类了，数据已经汇总好了。直接进入需要思考的状态。一天下来，注意力集中的时间明显变长了。

更意外的收获是我开始重新审视自己的工作。以前觉得"整理邮件"是工作的一部分，现在发现这事根本不需要人做。那我每天到底在创造什么价值？哪些事情是只有我能做的？哪些可以交给机器？

被这些问题推着，开始主动优化工作流程。

值不值得试

如果你也在做大量重复劳动，可以试试。

但要想清楚几件事：你的重复劳动得有规律（每天或每周固定要做），你得愿意花时间调试任务描述，你得接受它不是 100% 完美。

如果期待的是"点一下按钮，所有问题自动解决"，那会失望。这不是魔法。你需要理解它的能力边界，设计合理的流程，测试、调整、优化。但如果愿意花这个时间，回报是实打实的。

从哪里开始

建议从最简单、最机械的任务开始。

比如"每天收集某个数据"或"每周汇总某些信息"。流程固定，风险低，适合练手。跑通一个任务，你就会对它的能力有感觉，然后再往复杂的场景扩展。

别一上来就想做"全自动客户服务"或"智能决策助手"。会死得很惨。

最后

一周下来，我最大的感受是：重复劳动真的可以被"剪掉"。

不是所有工作都能自动化，但那些机械的、固定流程的、不需要创造性思考的部分，完全可以交给工具。

你省下的时间，可以用来做更值得做的事。或者，就是多睡一小时。

都挺好。