Anthropic 说中国 AI 公司蒸馏偷了 Claude 的技术，到底怎么回事？

摘要：Anthropic 指控 DeepSeek、月之暗面、MiniMax 三家中国公司通过 2.4 万假账号蒸馏 Claude 模型。什么是 AI 蒸馏？蒸馏合法吗？马斯克为什么说 Anthropic 贼喊捉贼？一文看懂这场争议。

美国 AI 公司 Anthropic 最近搞了个大新闻。2 月 23 日，它发了一份报告，直接点名三家中国公司——DeepSeek（深度求索）、月之暗面和 MiniMax，说它们"偷"了自己旗下 AI 模型 Claude 的能力。

具体怎么"偷"的呢？Anthropic 说这三家公司注册了大约 2.4 万个假账号，然后跟 Claude 聊了 1600 万次，把 Claude 的回答记录下来，用这些数据去训练自家的模型。这个操作在业内叫"蒸馏"。

什么是 AI 知识蒸馏

打个比方，你是个厨师学徒，跑到米其林餐厅去点了 1600 万道菜，把每道菜的味道、摆盘、食材都详细记下来，然后回去照着做。你没偷它的配方本，也没进它的厨房，但你通过大量品尝学会了它做菜的门道。

AI 蒸馏差不多就是这么回事。用一个强大模型的输出来训练另一个模型。这个技术 2015 年就有了，Google 和 Meta 自己也在用。

消息一出，马斯克在 X 平台上嘲讽 Anthropic"贼喊捉贼"。

马斯克的意思是：Anthropic 自己训练 Claude 的时候，用了大量网上的文章、书籍、代码，很多都没经过原作者同意。去年 9 月，Anthropic 还因为用了盗版书籍训练模型，赔了 15 亿美元和解金。

你自己拿别人的东西训练模型，现在别人用你模型的输出来学，你就说人家偷？这个道理确实有点说不通。

按 Anthropic 报告里的数据：

Anthropic 还说这些公司使用了很专业的手段来避免被发现，比如通过分散在各地的 IP 地址同时操控大量账号。

说实话，法律上目前没有定论。

AI 模型输出的内容，在大多数国家现在不受版权保护。你问 Claude 一个问题，它给你一个回答，这个回答不算 Anthropic 的"作品"。所以从版权角度看，蒸馏可能并不违法。

Anthropic 能抓住的点是"违反服务条款"——注册假账号、绕过地区限制，这些确实不合规。但违反服务条款跟"盗窃技术"是两回事，前者是民事违约，后者是知识产权侵权。

其实 Anthropic 不是第一个。OpenAI 在 2 月 12 日就向美国国会提交了备忘录，说 DeepSeek 蒸馏了它的模型。两家美国头部 AI 公司前后脚发起指控，时间上也挺耐人寻味的。

而且这个时间点正好是美国在讨论要不要放松对中国的 AI 芯片出口管制。Anthropic 在报告里明确把蒸馏和出口管制联系在一起，说限制芯片供应也能限制蒸馏规模。一家做 AI 的商业公司，把自己的商业利益和国家安全绑在一起，这个操作在硅谷很常见，但每次看到还是觉得微妙。

截至目前，三家被点名的公司都没有公开回应。

不过从市场看，这些公司日子过得不错。月之暗面的 Kimi K2.5 今年发布后收入创了新高，MiniMax 估值也在涨。不回应本身就是一种回应。

AI 行业现在的状态就是规则还没建好，大家已经在场上踢球了。谁的数据能用、蒸馏合不合法、跨国 AI 服务怎么管，没有清晰的答案。

Anthropic 告状也好，马斯克嘲讽也好，每个人都在挑对自己有利的说法。规则不清楚的时候就是这样。

Q：什么是 AI 蒸馏？ 就是用一个强大 AI 模型的回答去训练另一个较小的 AI 模型，让小模型学会大模型的能力。打个比方，就是去米其林餐厅把菜全尝一遍然后回去自己做。

Q：蒸馏和模型训练有什么区别？ 普通训练是用原始数据（文本、代码等）训练模型。蒸馏是用另一个已有模型的输出作为训练数据。蒸馏更像是"拜师学艺"而不是"从零自学"。

Q：Anthropic 指控了哪些中国公司？ DeepSeek（深度求索）、月之暗面（做 Kimi 的公司）和 MiniMax。

Q：马斯克为什么反对 Anthropic？ 因为 Anthropic 自己 2025 年赔了 15 亿美元，原因是用盗版书籍训练 Claude。马斯克认为这是双标。

参考来源：CNBC、Fortune、新京报、CNN、路透社