Anthropic 指控中国 AI 公司蒸馏 Claude，DeepSeek 月之暗面 MiniMax 到底谁有理？

摘要：2026 年 2 月，Anthropic 发布报告指控 DeepSeek、月之暗面和 MiniMax 对 Claude 模型进行知识蒸馏攻击。马斯克随即怒斥"贼喊捉贼"。AI 模型蒸馏到底合不合法？本文从技术、法律、行业双标三个角度分析这场争议。

2 月 23 号，Anthropic 发了一篇长文，指名道姓说 DeepSeek、月之暗面（Moonshot AI）和 MiniMax 三家中国 AI 公司对 Claude 进行了"工业级蒸馏攻击"。声称它们创建了大约 2.4 万个假账号，跟 Claude 交互了 1600 万次，目的是把 Claude 的推理和编程能力给"偷"走。

消息出来之后，马斯克第一个跳出来骂 Anthropic"贼喊捉贼"。他的逻辑很简单：Anthropic 自己 2025 年 9 月才因为未经授权使用盗版书籍等数据训练模型，赔了 15 亿美元和解金。你自己偷别人的数据训练模型，现在反过来告别人蒸馏你的输出？

说实话，这件事我想了好几天，越想越觉得复杂。

AI 知识蒸馏到底算不算"偷"技术？

先说技术层面。知识蒸馏（Knowledge Distillation）是 Geoffrey Hinton 在 2015 年发表的论文里就系统阐述过的技术，让大模型（教师模型）去教小模型（学生模型），通过输出来传递能力。Google、Meta、OpenAI 自己都在用。这个技术本身没有原罪。

问题出在"怎么蒸"。Anthropic 的指控重点是：这些公司用了假账号，绕过地区限制，违反了服务条款。从合同法角度看，违反 ToS 确实站不住脚。但违反 ToS 和"偷"是两码事。你去餐厅吃饭，菜端上来了，你拍了张照发朋友圈，餐厅能说你偷了他的配方吗？

更麻烦的是法律上的灰色地带。AI 模型的输出目前在多数司法管辖区不受版权保护。你问 Claude 一个问题，它给你一个回答，这个回答严格意义上不属于 Anthropic 的"作品"。蒸馏迁移的是功能逻辑，不是训练数据本身，更接近反向工程而不是复制。

Anthropic 的双标问题绕不过去

马斯克的嘲讽虽然刻薄，但确实点到了要害。

整个大模型行业建立在一个基础之上：大规模使用互联网公开数据进行训练。OpenAI 用了 Reddit 的帖子、Stack Overflow 的代码、无数人的博客文章。Anthropic 用了图书馆里的书。Google 用了整个互联网。这些数据的原始创作者大多没有被征求过意见，也没有拿到一分钱。

现在这些公司转过头来说"你不能用我的模型输出来训练你的模型"，逻辑上确实说不通。如果"合理使用"能保护你拿别人的数据训练模型，那同样的法律逻辑是不是也应该保护别人蒸馏你的输出？伯克利法学院有一篇分析文章专门讨论了这个问题，标题就叫"创新困境：OpenAI 诉 DeepSeek 案中的 AI 蒸馏"。结论是目前法律框架下，蒸馏的合法性边界相当模糊。

DeepSeek、月之暗面、MiniMax 的蒸馏操作细节

话说回来，2.4 万个假账号、1600 万次交互，这个规模确实不小。如果属实，至少说明这些公司知道自己在做的事情不太光明正大，否则为什么要用假账号？正常的学术研究或者技术开发，用真实身份去调用 API 就行了。

Anthropic 的报告里还提到了一些细节：这些账号使用了分布式 IP 地址，通过所谓的"九头蛇集群"架构同时管理 2 万多个账号来规避检测。这种操作方式确实看起来不太体面。

其中 MiniMax 的交互量最大，约 1300 万次；月之暗面次之，约 340 万次；DeepSeek 最少，约 15 万次，但据说针对性最强，专门瞄准 Claude 的推理能力和思维链输出。

Anthropic 和 OpenAI 接连指控的时机

这件事发生的时间点值得玩味。正好赶上美国国内讨论是否放松对华 AI 芯片出口管制，而 DeepSeek 的 R1 模型刚在全球引起轰动。Anthropic 在声明里把蒸馏和出口管制直接挂钩，说限制芯片获取不仅能限制中国公司直接训练大模型，也能限制它们蒸馏的规模。

这个论证思路本身就值得警惕。一家商业公司把自己的商业利益包装成国家安全议题，然后去游说政策，这在硅谷不是新鲜事，但每次看到还是让人不舒服。

而且 OpenAI 在 2 月 12 号就已经先跑去国会告了一状，说 DeepSeek 蒸馏了他们的模型。Anthropic 在 11 天后跟进。两家公司前后脚出手，你信是巧合吗？

我的看法

Anthropic 对服务条款被违反的指控可能是事实，但把它上升到"工业级攻击"和"国家安全威胁"的高度，商业纠纷武器化的意味太重了。

你能用别人的公开数据训练模型，别人能不能用你的公开 API 输出来蒸馏？没有人能给出一个干净利落的答案。

中国公司这边，如果确实用了假账号大规模违反 ToS，也没什么好洗的。月之暗面的 Kimi K2.5 发布后收入暴涨，说明不蒸馏一样能做出好产品。何必呢。

这场争议可能倒逼行业把 API 输出的产权归属和蒸馏边界给理清楚。理清楚之前，吵架不会停。

常见问题

Q：什么是 AI 知识蒸馏？ 知识蒸馏是用一个大模型（教师模型）的输出来训练一个小模型（学生模型），让小模型学会大模型的能力。Geoffrey Hinton 在 2015 年系统阐述了这一技术，Google、Meta、OpenAI 都在使用。

Q：Anthropic 指控了哪三家中国公司？ DeepSeek（深度求索）、月之暗面（Moonshot AI/Kimi）和 MiniMax。Anthropic 称三家公司共创建约 2.4 万个假账号，与 Claude 交互 1600 万次。

Q：AI 模型蒸馏合法吗？ 目前没有定论。AI 模型输出在多数国家不受版权保护，但违反服务条款属于合同违约。蒸馏的法律边界还处于灰色地带。

Q：马斯克为什么骂 Anthropic 贼喊捉贼？ 因为 Anthropic 在 2025 年 9 月因使用盗版书籍等未授权数据训练 Claude，支付了 15 亿美元和解金。马斯克认为 Anthropic 自己也靠未授权数据起家，指控别人蒸馏属于双标。

参考来源：CNBC、Fortune、The Verge、CNN、南华早报、新京报、路透社、伯克利法学院