16个Claude组队做出大项目:它的协作机制对我们有什么启发?

16个Claude组队做出大项目:它的协作机制对我们有什么启发?

2026年2月,Anthropic研究员Nicholas Carlini做了一件事:指挥16个Claude Opus 4.6实例,从零开始构建了一个C编译器。

不是玩具级的编译器。这个编译器能编译可启动的Linux 6.9内核,支持x86、ARM、RISC-V三种架构。产出10万行Rust代码。历时两周,花了大约20000美元,跑了近2000个Claude Code会话。

Arstechnica做了详细报道。我读完之后的感受挺复杂的:一方面觉得这个成果确实厉害,另一方面又觉得很多细节需要冷静看待。

01 去中心化:没有"老板"Agent

这个项目最让我意外的设计选择是:没有中央编排Agent。

多数多Agent框架都有一个Lead Agent或者Orchestrator的角色,负责分配任务、汇总结果、处理冲突。Carlini没用这种架构。16个Claude实例各自独立运行在自己的Docker容器里,自行判断该做什么。

没有谁告诉Agent A去写词法分析器、Agent B去写语法解析器。每个Agent启动后自己读取项目状态,自己决定下一步做什么。

这种设计的好处是消除了单点瓶颈。一个中央编排Agent如果判断失误,会影响所有下游Agent的工作。去中心化之后,一个Agent犯错只影响它自己负责的那块。

02 Git仓库:唯一的通信渠道

16个Agent之间不直接对话。它们通过同一个Git仓库来协调工作。这是整个系统里唯一的"通信渠道"。

每个Agent定期拉取最新代码,看看别人做了什么,然后基于当前状态决定自己的下一步。需要声明"这个任务我在做"的时候,通过创建lock文件来占位,防止其他Agent重复劳动。

我第一次看到这个设计的时候觉得太原始了。2026年了还用lock文件做协调?但仔细想想,这种简单粗暴的方式反而避免了复杂通信协议带来的各种问题。Git本身就是一个经过几十年验证的分布式协作工具,没必要在上面再叠一层抽象。

merge conflict怎么办?每个Agent自己处理。拉取代码发现冲突了,自行解决,不需要人工干预。这对Agent的代码理解能力要求很高,但Claude Opus 4.6在这方面的表现看起来够用。

03 人在哪里

Carlini在这个项目里的角色是什么?他自己的描述是:大方向指导和任务定义。

具体实现完全交给Agent。他不review每一行代码,不审批每一次commit。他定义阶段性目标("先让词法分析器跑起来""接下来实现类型系统"),然后让16个Agent去执行。

这跟传统的项目管理方式差别很大。大多数技术主管会在代码层面做详细的review和指导。Carlini更像是定义了"我们要去哪里",至于"怎么去"由Agent自己决定。

两周时间,近2000个会话。平均每天140多个会话。如果Carlini要手动检查每个会话的输出,每天光看就来不及。放手信任Agent是唯一可行的策略。

04 冷静看待这个成果

两万美元不便宜。对一个研究项目来说可以接受,对实际的工程项目来说需要跟人力成本做认真对比。两周时间写10万行代码,如果雇四五个有编译器经验的工程师,同样的时间和成本能做到什么程度?这个对比我没有答案,但应该有人去算。

两周不算快。编译器是一个已经被充分研究的领域,算法和架构都有现成的教科书可以参考。Agent在这种"知识存量充足"的领域表现好是可以预期的。换一个文档稀缺、需要创造性设计的领域,结果可能很不一样。

10万行代码的质量我们外人无法直接评估。代码行数本身不说明问题,一个写了10万行的编译器和一个写了5万行的编译器,后者的工程质量可能更高。Carlini说编译器能跑起Linux内核,这是一个很硬的功能验证,但代码的可维护性、可读性、性能优化程度,这些需要看源码才能判断。

05 对人类团队管理的启发

抛开AI不谈,这个项目的协作机制对人类团队管理有几个值得想的点。

明确的任务边界比微观管理更有效。Carlini不告诉Agent每一步怎么做,只告诉它们目标是什么。这跟管理学里一直说的"给目标不给路径"是一回事,但多少管理者真正做到了?大部分人还是忍不住要指挥每一个细节。

通过约定而不是层级来协调。16个Agent之间没有上下级关系,靠Git仓库和lock文件这种简单约定来避免冲突。人类团队也可以思考:有多少协调工作是因为层级汇报造成的?如果团队成员都遵守同一套明确的规则,还需要那么多会议吗?

让执行者自行判断和解决问题。Agent遇到merge conflict不上报,自己处理。这对人类团队来说意味着:如果你招的人足够好,给他们足够的自主权,他们能处理比你预想的更多的事情。

当然,这些启发有一个前提:Agent没有情绪、没有政治、没有职业发展诉求。人类团队的管理复杂度有一大半来自这些AI不需要面对的东西。把AI协作的经验直接搬到人类团队管理上,需要打很大的折扣。


参考链接: https://arstechnica.com/ai/2026/02/sixteen-claude-ai-agents-working-together-created-a-new-c-compiler https://code.claude.com/docs/en/agent-teams https://www.claude.com/blog/how-anthropic-teams-use-claude-code https://www.anthropic.com/news/how-anthropic-teams-use-claude-code

← 返回博客列表