我用 clawdbot 把重复劳动"剪掉"了:一周实战复盘

我用 clawdbot 把重复劳动"剪掉"了:一周实战复盘

周一早上起来,发现周末积了 47 封未读邮件。花半小时分类:技术问题转给开发,商务咨询标记待回复,垃圾邮件删掉。分完类已经过了 9 点半,正事还没开始干。

每天都这样。整理邮件、更新进度表、催进度、汇总数据、写周报。这些事情不难,就是占时间。做完一天,真正"创造价值"的时间可能就两三个小时。

上周在社区里看到有人分享用 clawdbot 处理重复任务,我决定试试。一周后,那 47 封邮件的活儿变成了"早上看十分钟处理结果"。

记录一下这一周我用 clawdbot 做了什么,踩了哪些坑,值不值得。

为什么是 clawdbot

之前试过 Zapier 和 n8n。它们适合处理固定流程的事,比如"收到邮件就发通知"。但稍微复杂点就不行了。

拿邮件分类来说。传统自动化只能匹配关键词:"主题里有'bug'就是技术问题,有'合作'就是商务咨询。"但客户描述问题五花八门,关键词匹配根本不靠谱。

clawdbot 不一样。官方文档提到它基于 Claude 这类大语言模型,能理解内容语义。不是简单匹配词,而是读懂邮件在说什么。还能直接调 API 或操作浏览器,覆盖的场景更广。

而且它开源,可以在本地跑。我数据敏感,不想把客户信息传给第三方平台。

第一天:邮件自动分类

我的第一个目标很简单:让它帮我把邮件分类。

我每天收的邮件大概分四类:

  1. 技术问题(客户报 bug 或者问功能)
  2. 商务咨询(问价格、合作、试用)
  3. 日常通知(系统邮件、订阅内容)
  4. 垃圾邮件

手动分类每天要花 20-30 分钟。我想让 clawdbot 帮我做。

设置任务:

每小时扫描邮箱,把新邮件按内容分成四类,打标签。技术问题发通知到 Slack 并@技术负责人,商务咨询标记"待回复"并生成一句话摘要。

第一次跑,分类准确率大概 70%。有些邮件被误判了。比如客户说"想了解一下你们的技术方案",被分到技术问题,其实这是商务咨询。

我调整了任务描述,增加了判断逻辑:

商务咨询:询问价格、合作、试用、采购、技术方案介绍。 技术问题:报错、功能不工作、使用困惑、API 调用失败。

调整后准确率到了 85% 左右。边界情况还是会出错,但已经能用。我每天早上检查一遍分类结果,发现错误手动调整,顺便优化任务描述。

第一天成果: 邮件分类从每天 30 分钟降到 5 分钟检查 + 偶尔调整。

第二天:自动生成周报初稿

每周五要写周报,汇总本周工作。之前的流程是:

  1. 翻看本周的 Slack 消息,找关键事件
  2. 查看项目管理工具,看完成了哪些任务
  3. 回顾邮件,看处理了哪些客户问题
  4. 整理成周报,发给老板

这套流程每次要 1-2 小时。

我让 clawdbot 帮我做前三步:

每周五下午 4 点,检索本周 Slack 消息、项目管理工具的任务完成记录、客户邮件处理记录。按"技术开发、客户支持、商务对接"分类,生成周报初稿。

跑出来的结果是一份结构化的清单。它把本周所有操作都列出来了,太详细。"周一 10:15 回复了客户 A 的邮件,询问 API 调用问题",这种流水账没人想看。

我修改任务:

每周五下午 4 点,检索本周 Slack 消息、项目管理工具的任务完成记录、客户邮件处理记录。提取关键事件(项目里程碑、重大 bug 修复、重要客户对接),按"技术开发、客户支持、商务对接"分类,每条用一句话概括。

改完后生成的初稿简洁多了。只需要微调语气、补充细节,10 分钟完成周报。

第二天成果: 周报从 1-2 小时降到 10-15 分钟。

第三天:自动催进度

我负责几个外包项目。每周要问外包团队进度,他们回复后我要更新到项目管理工具。

之前流程:

  1. 周三上午给每个外包团队发邮件:"本周进度如何?"
  2. 他们回复(有的当天回,有的拖到周五)
  3. 我把回复内容手动复制到项目管理工具,更新状态

很机械,但不做不行。

我让 clawdbot 自动催:

每周三上午 9 点,给"外包团队列表"里的每个团队发邮件,询问本周进度。收到回复后,提取关键信息(完成了什么、遇到什么问题、下周计划),更新到项目管理工具的对应项目。

这里踩了个坑。第一次跑的时候,它给所有外包团队发了同一封邮件,内容太生硬:"请汇报本周进度。" 外包团队回复说"这邮件是机器人发的吗?"

不能让它看起来太机器人。我调整了邮件模板:

邮件内容要带上项目名称和上周的进度作为上下文,语气要自然。比如"Hi [团队名],上周你们提到在做 [功能],这周进展如何?有没有遇到阻碍?"

改完后外包团队回复率明显高了,回复内容也更详细。clawdbot 提取关键信息的准确率不错,每周检查一遍更新结果就行。

第三天成果: 催进度和更新项目状态从每周 1 小时降到 10 分钟检查。

第四天:数据汇总和简报

每天下午 5 点,老板要看当天的数据简报:新增用户数、活跃用户数、新增订单、客户反馈数量。

我之前的做法是手动登录各个后台,复制数字,粘贴到 Excel,然后截图发给老板。每天 15 分钟。

这事完全可以自动化。我让 clawdbot 做:

每天下午 4:50,访问后台系统,提取今日新增用户、活跃用户、新增订单、客户反馈数量。生成一张简洁的表格,发到 Slack 的"每日数据"频道并@老板。

第一次跑失败了。后台系统需要登录,clawdbot 卡在登录页面。

翻文档发现可以给它配置浏览器的 session。我手动登录一次,把 session 保存下来,让 clawdbot 用这个 session 访问。

第二次跑成功了,但数据不对。它提取的"新增用户数"是总用户数。检查后发现,后台的"今日新增"和"总数"显示在同一个页面,它搞混了。

调整任务,明确告诉它"提取标签为'今日新增'的数字,不是'总计'下面的数字"。第三次跑,数据对了。连续跑了三天,每天核对数字,没发现错误。

第四天成果: 数据汇总从每天 15 分钟降到 0 分钟(全自动)。

第五天:客户问题自动回复(部分)

客户经常问一些重复的问题:

  • 怎么重置密码?
  • API 调用限制是多少?
  • 数据存储在哪里?

这些问题我们文档里都有,但客户懒得看文档,直接发邮件问。每天要回复 5-10 封这种邮件。

我让 clawdbot 做:

收到客户邮件,判断是否是常见问题(参考知识库)。如果是,生成回复草稿(引用文档链接 + 一句话解释),发给我审核。我确认后发送。

这里我留了人工审核环节。对外回复不能出错,万一它理解错了客户的问题,回复不对就麻烦了。

跑了一天,它识别出 8 封常见问题邮件,生成了回复草稿。检查后发现,有 1 封理解错了(客户问"API 限制",它理解成"API 报错"),其他 7 封都对。

修改那 1 封后发送,其他的直接发送。原本要自己写 8 封回复,现在变成"检查 8 封草稿 + 修改 1 封"。时间从 30 分钟降到 10 分钟。

第五天成果: 常见问题回复时间降到原来 1/3。

第六天:处理数据导出请求

我们有个客户每周五要导出一份数据报表。流程很固定:

  1. 登录后台
  2. 选择时间范围(本周一到周五)
  3. 选择数据类型(用户行为日志)
  4. 导出 CSV
  5. 发邮件给客户

每次 10 分钟,但每周都要做。

我让 clawdbot 自动跑:

每周五下午 3 点,登录后台,选择"本周一到周五"的用户行为日志,导出 CSV,发邮件给客户 X。

第一次跑的时候,它把上周的数据导出了。发现它在选择时间范围时选错了。

检查后发现,后台的日期选择器是个日历控件,需要点两次(选开始日期和结束日期)。clawdbot 第一次没点对。

把任务描述改得更详细:

点击"开始日期",选择本周一的日期;点击"结束日期",选择本周五的日期。确认日期范围显示为"YYYY-MM-DD 至 YYYY-MM-DD"后再点击导出。

改完之后跑通了。

第六天成果: 数据导出任务完全自动化,每周省 10 分钟。

一周下来省了多少时间

到周末统计了一下:

任务 之前耗时 现在耗时 节省
邮件分类 每天 30 分钟 每天 5 分钟 每天 25 分钟
周报生成 每周 1-2 小时 每周 10 分钟 每周 1 小时
催进度 每周 1 小时 每周 10 分钟 每周 50 分钟
数据汇总 每天 15 分钟 0 分钟 每天 15 分钟
常见问题回复 每天 30 分钟 每天 10 分钟 每天 20 分钟
数据导出 每周 10 分钟 0 分钟 每周 10 分钟

每周省出来的时间大概 7-8 小时。

踩的坑

这一周不是一帆风顺,总结几个坑:

浏览器操作不稳定

clawdbot 操作浏览器时,页面加载慢或者元素位置变了,可能会点错。解决办法是尽量用 API。邮件、Slack、项目管理工具都有 API,直接调 API 比浏览器操作快、稳定、便宜。只有后台系统没 API 才用浏览器。

语义理解有边界

它能理解大部分邮件内容,但碰到特别口语化或者专业术语多的邮件会理解错。没办法完全解决,只能留人工审核环节。对外回复、写入操作,都保留了"生成草稿→人工检查→执行"的流程。

权限和安全

给 clawdbot 配置各种工具的 API key 和登录凭证时要小心。我专门创建了一个"bot 专用账号",权限设得很低(只能读邮件、发消息,不能删数据、改配置)。

Token 消耗

前两天让它做太多浏览器操作,token 烧得很快。后来改成 API 调用,成本降了一大半。现在的原则是:能用 API 就用 API,用不了再考虑浏览器。

任务描述需要迭代

第一次写任务描述基本不会一次成功。要测试、发现问题、调整描述,反复几次才能跑稳。邮件分类任务改了三次描述才达到 85% 准确率,催进度的邮件模板也是改了两次才自然。

成本核算

用了一周 clawdbot,花了多少钱?

我主要用的是 Claude Sonnet API。根据社区里的经验,输出 token 是 $15/百万。粗算一下这一周的消耗:

  • 邮件分类:每天 50 封,每次 500 tokens = 2.5 万 tokens/天
  • 周报生成:每次 5000 tokens,每周 1 次
  • 催进度:每周 5 封邮件,每封 500 tokens = 2500 tokens/周
  • 数据汇总:用浏览器操作,token 消耗大,每次 3000 tokens = 2.1 万 tokens/天
  • 常见问题回复:每天 8 封,每次 800 tokens = 6400 tokens/天
  • 数据导出:每次 3000 tokens,每周 1 次

每天 5 万 tokens 左右,一周下来 35 万 tokens。按 $15/百万算,花了 $5-6。

一周省 8 小时,花 $5。值。

省时间只是表面收益

用了一周,发现一件事:clawdbot 最大的价值不是省时间。

之前每天花 1-2 小时处理邮件、整理数据、催进度,做完这些事人已经累了,不想动脑子了。剩下的时间就是应付式地干活。

现在这些机械活儿不用我做了。早上上班,邮件已经分好类了,数据已经汇总好了。直接进入需要思考的状态。一天下来,注意力集中的时间明显变长了。

更意外的收获是我开始重新审视自己的工作。以前觉得"整理邮件"是工作的一部分,现在发现这事根本不需要人做。那我每天到底在创造什么价值?哪些事情是只有我能做的?哪些可以交给机器?

被这些问题推着,开始主动优化工作流程。

值不值得试

如果你也在做大量重复劳动,可以试试。

但要想清楚几件事:你的重复劳动得有规律(每天或每周固定要做),你得愿意花时间调试任务描述,你得接受它不是 100% 完美。

如果期待的是"点一下按钮,所有问题自动解决",那会失望。这不是魔法。你需要理解它的能力边界,设计合理的流程,测试、调整、优化。但如果愿意花这个时间,回报是实打实的。

从哪里开始

建议从最简单、最机械的任务开始。

比如"每天收集某个数据"或"每周汇总某些信息"。流程固定,风险低,适合练手。跑通一个任务,你就会对它的能力有感觉,然后再往复杂的场景扩展。

别一上来就想做"全自动客户服务"或"智能决策助手"。会死得很惨。

最后

一周下来,我最大的感受是:重复劳动真的可以被"剪掉"。

不是所有工作都能自动化,但那些机械的、固定流程的、不需要创造性思考的部分,完全可以交给工具。

你省下的时间,可以用来做更值得做的事。或者,就是多睡一小时。

都挺好。

← 返回博客列表